文档详情

SPSS数据的基本统计分析.pptx

发布:2019-12-02约9.92千字共57页下载文档
文本预览下载声明
SPSS基本统计分析单变量的频数分析单变量的基本描述统计量的计算多变量的交叉频数表的编制和分析探索性分析数据的多选项分析 1.频数分析通过频数分析能够了解变量取值的状况,把握数据的分布特征,能反映样本是否具有总体代表性,抽样是否存在系统偏差等。频数分布分析过程(1)程序:分析(analyze)-描述统计(descriptive)-频数(frequency)(2)选择一个或多个频数分析变量放进‘变量’框中(3)选中右下角‘显示频数表格’(4)点击‘统计量’、‘图表’、‘格式’依次进行设置选择统计量待分析变量源变量框选择图表选择输出格式要求输出频数分析表格 制作频数分布表(频数、百分比):以表格形式呈现各个数据的次数分布情况,包括频数、百分比,有效百分比、累计百分比。把数值平均分为n份,每个等分位点对应的变量值(2≤n≤100)集中趋势测量百分位数选项第25、50、75个百分位数点对应的变量值对于分组数据,计算百分位数值和中位数时,用各组的组中值代表各组数据。指定输出多个百分位数离散趋势测量数据分布形态的偏斜度和方向数据分布形态的陡缓程度分位数是变量在不同分位点上的取值,从一个侧面清楚地刻画了变量的取值分布状态。分位数差是一种描述数据离散程度的方式。分位数差越大,表示数据在相应分位段上的离散程度越大。峰度(Kurtosis) : 是描述某变量所有取值的分布形态陡缓程度的统计量,而峰度对陡缓程度的度量是与正态分布进行比较的结果。如果峰度等于0 ,其数据分布的陡缓程度与正态分布相同;峰度大于0,其数据分布比正态分布更陡峭;峰度小于0,其数据分布比正态分布更平坦。偏度(Skewness):是描述数据分布对称性的统计量,而且也是与正态分布的对称性相比较而得到的。如果分布的偏度等于0 ,则其数据分布的对称性与正态分布相同;如果偏度大于0,则其分布为正偏或右偏;如果偏度小于0,则为负偏或左偏。均值:某变量所有取值的平均水平,其大小易受到数据中极端值的影响。众数Mode:是一组数据中出现次数最多的数据。中位数Median:一组数据按升序排序后处于中间位置的数据。均值标准误差:是描述样本均值与总体均值之间差异程度的统计量。标准差:反映变量取值距离均值的平均离散程度。其值越大,变量间的差异越大。方差:是标准差的平方,反映变量取值离散程度。其值越大,变量间的差异越大。全距range:也称为极差,是数据最大值与最小值之间的绝对差,也是反映变量取值的离散程度。不同等级的变量描述性指标集中趋势Central tendency (一组数据向某一中心靠拢的倾向)离散趋势Dispersion(一组数据远离其‘中心值’的程度)定类众数Mode异众比率V定序中位数Median四分位差Quartiles定距 定比均值Mean全距 Range方差 Variance标准差Std.deviant均值中位数 众数众数中位数均值均值= 中位数= 众数 左偏 对称分布 右偏 不输出任何图形输出条形图输出饼图直方图输出正态分布曲线直方图:是用矩形的面积来表示频数分布变化的图形。适用于连续性数据,即:定距数据条形图、饼图:适用于离散型数据,即定序、定类和分组后的定距数据。其中,条形图(bar chart)是用宽度相同的条形的高度或长短来表示频数分布变化的图形;饼图(pie chart)是用圆形或圆内扇形的面积来表示频数分布变化的图形。案例分析:居民储蓄调查数据目标一:分析储户的户口和职业的基本情况;目标二:分析储户一次存(取)款金额的分布,并对城镇储户和农村储户进行分析比较。目标一:被调查者的户口和职业情况的频数分布表和统计图目标二:分析储户一次存(取)款金额的分布,并对城镇储户和农村储户进行分析比较。分析思路:由于存(取)款金额属于定距型变量,直接采用频数分析不利于对分布形态的把握。 运用数据预处理中的‘数据分组’功能对数据分组后再编制频数分布表。如:将(取)款金额重新分成5组:少于500元、500-2000、2000-3500、3500-5000、5000以上。对比城镇储户和农村储户情况,可采用数据预处理中的‘数据拆分’并计算样本存(取)款金额的四分位数、峰度、偏度等。储户一次存(取)款金额的分布情况:被调查者有近一半的储户一次存取款金额在500元以下,2000-3500元的最少。从图形看来,储户的存(取)款金额呈明显的右偏分布,即一次存取款金额偏低的占较大比例,也有少数金额偏高的储户。城镇和农村居民储户一次存(取)款金额的比较:从均值以及四分位数差可以看出城镇储户存取款金额的离散度大于农村储户(尤其在高金额区),且城镇储户的存取款金额高于农村储户。 2.基本描述性统计分析基本的描述性统计量大致有三类:一是刻画集中趋势的描述统计量;二是刻画离散程度的描述统计量;三是
显示全部
相似文档