第四章SPSS基本统计分析.doc
文本预览下载声明
第四章
SPSS基本统计分析
——描述性统计分析
描述性统计分析是统计分析的第一步,做好这第一步是下面进行正确统计推断的先决条件。SPSS的许多模块均可完成描述性分析,但专门为该目的而设计的几个模块则集中在Descriptive Statistics菜单中,包括:
Frequencies:频数分析过程,特色是产生频数表(主要针对分类变量)
Descriptives:数据描述过程,进行一般性的统计描述(主要针对数值型变量)
Explore:数据探察过程,用于对数据概况不清时的探索性分析
Crosstabs:多维频数分布交叉表分析(列联表分析)
Ratio statistics:比率分析
4.1 频数分析
4.1.1 频数分析的目的和基本任务
目的
基本统计分析往往从频数分析开始。通过频数分析能够了解变量取值的状况,对把握数据的分布特征是非常有用的。
2、基本任务
(1)频数分析的第一个基本任务是编制频数分布表。
频数(Frequency):即变量值落在某个区间(或某个类别)中的次数
百分比(Percent):即各频数占总样本数的百分比
有效百分比(Valid Percent):即各频数占有效样本数的百分比,这里有效样本数=总样本-缺失样本数
累计百分比(Cumulative Percent):即各百分比逐级累加起来的结果。最终取值为100。
(2)频数分析的第二个任务是绘制统计图
条形图(Bar Chart):用宽度相同的条形的高度或长短来表示频数分布变化的图形,适用于定序和定类变量的分析。
饼图(Pie Chart):用圆形及圆内扇形的面积来表示频数百分比变化的图形,以利于研究事物内在结构组成等问题。
直方图(Histograms):用矩形的面积来表示频数分布变化的图形,适用于定距型变量的分析。
注:变量的计量尺度:
a 定类 (Category Scale):只能计次
b 定序 (Ordinal Scale):计次、排序
c 定距(Interval Scale):计次、排序、加减
d 定比 (Ratio Scale):计次、排序、加减、乘除
4.1.2 频数分析的基本操作
(1)选择菜单Analyze—Descriptive Statistics—Frequencies。
(2)将若干频数分析变量选择到Variable(s)框中。
(3)单击Chart按钮选择绘制统计图形,在Chart Values框中选择条形图中纵坐标(或饼图中扇形面积)的含义,其中Frequencies表示频数;Percentages表示百分比。
4.1.3 SPSS频数分析的扩展功能
1、计算分位数(Percentile Values)
分位数是变量在不同分位点上的取值。分位点在0-100之间。一般使用较多的是四分位点(Quartiles),即将所有数据按升序排序后平均等分成四份,各分位点依次是25%,50%,75%。于是四分位数便分别是25%,50%,75%点所对应的变量值。此外,还有八分位数、十六分位数等。
SPSS提供了计算任意分位数的功能,用户可以指定将数据等分为n份(Cut points for n equal groups)。还可以直接指定分位点(Percentile)。
2、计算其他基本描述统计量
SPSS频数分析还能够计算其他基本统计量,其中包括描述集中趋势(Central Tendency)的基本统计量、描述离散程度(Dispersion)的基本统计量、描述分布形态(Distribution)的基本统计量等。
设置频数表输出的格式
分析:
其中: 为总体标准差,n为样本单位数
2、刻画离散程度的描述统计量
离散程度是指一组数据远离其“中心值”的程度。
如果数据都紧密地集中在“中心值”的周围,数据的离散程度较小,说明这个“中心值”对数据的代表性好;相反,如果数据仅是比较松散地分布在“中心值”的周围,数据的离散程度较大,则此“中心值”说明数据特征是不具有代表性的。
常见的刻画离散程度的描述统计量如下:
(1)全距(Range):也称极差,是数据的最大值(Maximum)与最小值(Minimum)之间的绝对离差。
(2)方差(Variance):也是表示变量取值离散程度的统计量,是各变量值与算数平均数离差平方的算术平均数。其计算公式为:
(3)标准差(Standard Deviation:Std Dev):表示变量取值距离均值的平均离散程度的统计量。其计算公式为:
标准差值越大,说明变量值之间的差异越大,距均值这个“中心值”的离散趋势越大。
3、刻画分布形态的描述统计量
数据的分布形态主要指数据分布是否对称
显示全部