基本统计分析.ppt.ppt
文本预览下载声明
第四章 基本统计分析 4.1 频数分析 Frequencies 频数分析的基本任务:编制频数分布表和绘制统计图。 频数分析的扩展功能:计算分位数和计算其它基本的描述统计量(包括:集中趋势、离散程度、分布形态) 注意:这里计算基本统计量的功能在Descriptive也可以实现。故不作重点讲解。 主对话框 计算基本统计量 Statistics… 绘制统计图 Charts… 频数分布表输出格式 Format… 4.2 计算描述统计量 Descriptive 偏度与峰度 分布形态主要是指数据分布是否对称,偏斜程度如何,分布陡缓程度如何。 偏度(Skewness):反映数据分布对称性的统计量。 当数据为对称分布时偏度为零;当数据为正偏态分布(右偏)时偏度大于零;当数据为负偏态分布(左偏)时偏度小于零。 峰度(Kurtosis):以标准正态分布为标准描述该分布密度的形状为陡缓程度的统计量。 当数据为标准正态分布时,峰度为零;数据分布为尖峰分布时峰度大于零;数据分布为平峰分布时峰度小于零。 标准化Z分数问题 标准化Z分数问题:通过标准化过程可得到一系列新变量值,通常称为标准化值或Z分数。 标准化过程: 标准化变量的作用:可以发现变量中的极大值和极小值,以便发现分布是否均衡的问题。 描述统计分析的结果指标与频数分析过程基本相同,区别在于:Descriptive只计算几个主要的描述指标,不同时输出频数分布图表。 主对话框 4.3 交叉分组下的频数分析 Crosstabs 列联表分析的目的:分析多个变量不同取值下的分布,掌握多变量的联合分布特征,进而分析变量之间的相互影响和关系。 两大基本任务:一,产生两维或多维交叉列联表; 二,对两两变量间是否存在一定的相关性进行卡方检验和相关性检验。 交叉列联表行列变量间关系的分析 所有观测频数都出现在主对角线上,则两变量存在正相关。 所有观测频数都出现在负对角线上,则两变量存在负相关。 主对话框 Cells Format 卡方检验及其它相关分析 卡方检验的作用:可用于探讨列联表行变量和列变量之间是否有关联的推断性分析。若无关联,则认为两变量独立。 卡方检验的统计量(Pearson卡方统计量): 决策方法:若卡方观测值的概率p小于等于a,则判定行列变量间存在存在依存关系;反之,如果卡方观测值的概率p大于a,则判定行列变量间相互独立。这里a=0.05或0.01。 卡方检验注意事项:一,列联表的单元格不应太少,例如2*2的列联表需要进行连续型修正和采用Fisher精确检验进行校对。二,各单元格中的期望频数,不应有大量的期望频数小于5的单元格。若列联表中有20%以上的单元格的期望频数小于5,则一般不宜用卡方检验。三,总频数n应较大,一般至少大于50,大于100更好。 四大类相关分析的检验方法。判断方法:系数的绝对值越接近于1,则变量的相关性越强;越接近于0,则变量间相互独立。正负号代表相关方向。 Statistics 4.5 比率分析 Ratio 比率分析用于对两变量间变量值比率变化的描述分析,适用于定距变量。当研究者特别关心该比率在不同组间的变动情况是,该过程非常有用。 描述分析基本包括两大类:一类是集中趋势的描述指标,另一类是离散程度描述指标。 4.4 多选项分析 多选项分析主要是针对问卷调查的多选项问题的。本节主要讨论多选项问题结果的保存(多选项问题的分解),以及多选项问题的频数分析。 多选项问题分解的两种办法:第一,多选项二分法;第二,多选项分类法。 频数分析的两步骤:第一,定义多选项变量集;第二,作多选项频数分析或交叉分组下的频数分析。 Define Sets Frequencies Crosstabs 指定变量集中的变量是按哪种方法分解的 为变量集命名 表示选中的数值 注意:Spss规定只要样本在多选项变量集中的某一个变量上取缺失值,分析时就将该样本剔出。 279×3=837 行变量 列变量 定义变量的取值范围 分母为样本数 分母为多选项应答数 * 频数分析 描述统计过程 互联表统计分析 比率分析 探索性统计过程 显示频数分布表 百分位数 离散趋势指标 集中趋势指标 采用组中值计算 分布形态指标 四分位数 每隔指定百分位数 直接指定某个百分位数 带正态曲线的直方图 饼状图 条形图 频数 频率 针对Bar/Pie Charts而言,纵轴表示的数值 按变量值 按频数 当频数表的分组数大于下面指定数值时禁止它在结果中输出,这样可以避免产生巨型表格。 当选择两个以上变量作频数表时,C可以将结果输出在同一频数表过程的output;O可以将结果输出在不同的output。 按变量值升序排列 这里是定类变量,计算累计百分比是无意义
显示全部