第2章描述性统计分析.doc
文本预览下载声明
第2章 描述性统计分析
SPSS中的描述统计命令包括一系列的分析功能:频率、描述、探索、交叉表、比率图等。这些分析的结果(统计量和图形)有助于我们 了解数据的分布特征。
实验2-1 频数分析
(1)频数:指一组数据中个别数据重复出现的次数或一组数据在某个确定的范围内出现的数据的个数. (2)频率:是频数与数据组中所含数据的个数的比。
注:
偏度0:左偏
偏度0:右偏
偏度=0:正态分布
峰度=0:正态
峰度0:平顶分布
峰度0:尖顶分布
数据文件: sample\Chap02\fre.sav
操作过程:
分析—描述统计—频率
实验过程:
注:
割点(Cut points):选择此项,在后面的文本框中输入数值,假设为N(N为在2 100之间的整数),则计算并显示N分位数。
输出结果:
频率
[数据集1] J: \sample\Chap02\FRE.SAV
统计量
血清总蛋白(serum,克/升)
N
有效
100
缺失
0
均值
73.696
均值的标准误
.3926
中值
73.792a
众数
73.5
标准差
3.9264
方差
15.417
偏度
.039
偏度的标准误
.241
峰度
.071
峰度的标准误
.478
全距
20.0
极小值
64.3
极大值
84.3
和
7369.6
百分位数
25
71.200b
50
73.792
75
75.975
a. 利用分组数据进行计算。
b. 将利用分组数据计算百分位数。
血清总蛋白(serum,克/升)
频率
百分比
有效百分比
累积百分比
有效
64.3
1
1.0
1.0
1.0
65.0
2
2.0
2.0
3.0
67.2
1
1.0
1.0
4.0
67.3
4
4.0
4.0
8.0
68.0
2
2.0
2.0
10.0
68.8
3
3.0
3.0
13.0
69.7
3
3.0
3.0
16.0
70.3
1
1.0
1.0
17.0
70.4
6
6.0
6.0
23.0
71.2
4
4.0
4.0
27.0
72.0
7
7.0
7.0
34.0
72.7
7
7.0
7.0
41.0
73.5
11
11.0
11.0
52.0
74.0
1
1.0
1.0
53.0
74.3
8
8.0
8.0
61.0
74.7
1
1.0
1.0
62.0
75.0
7
7.0
7.0
69.0
75.4
1
1.0
1.0
70.0
75.6
1
1.0
1.0
71.0
75.8
5
5.0
5.0
76.0
76.5
7
7.0
7.0
83.0
77.2
2
2.0
2.0
85.0
77.6
1
1.0
1.0
86.0
78.0
1
1.0
1.0
87.0
78.8
3
3.0
3.0
90.0
79.5
3
3.0
3.0
93.0
80.3
1
1.0
1.0
94.0
80.5
2
2.0
2.0
96.0
81.2
1
1.0
1.0
97.0
81.6
2
2.0
2.0
99.0
84.3
1
1.0
1.0
100.0
合计
100
100.0
100.0
实验2-2 描述统计量
数据文件:sample/Chap02/desc.sav
该文件记录了某地区130名正常男子血液中的红细胞数(RBC,万/mm)
实验过程:
分析—描述统计—描述
输出结果:
描述
[数据集2] J: \sample\Chap02\DESC.SAV
描述统计量
N
全距
极小值
极大值
均值
标准差
方差
偏度
峰度
统计量
统计量
统计量
统计量
统计量
统计量
统计量
统计量
标准误
统计量
标准误
红细胞数(RBC)
130
209
379
588
479.35
41.506
1722.773
.011
.212
-.140
.422
有效的 N (列表状态)
130
实验2-3 数据探索
意义:检查或发现数据中的错误;探索变量的分布特征。
重点:探索|图菜单,可显示变量彼此之间的差异。
数据文件:sample/Chap02/child.sav
实验过程:
输出结果:
浏览
附注
创建的输出
30-MAY-2016 16:22:07
注释
输入
数据
J:\2015-2016学年下学期统计软件与应用\自编讲义\sample\Chap02\child.SAV
活动的数据集
数据集3
过滤器
none
权重
none
拆分文件
none
工作数据文件中的 N 行
97
缺失值处理
对缺失的定义
用户为因变量定义的缺失值作为缺失对待。
使用的案例
统计量的计算基于这样的案例,此类案例针对用到的任何因变量或因子均不包含缺失值。
语法
EXAMINE VARIABLES=y5 BY y2
/PLOT BOX
显示全部