主成分分析SPSS操作步骤.doc
文本预览下载声明
主成分分析SPSS操作步骤
以教材第五章习题8的数据为例,演示并说明主成分分析的详细步骤:
原始数据的输入
注意事项:关键注意设置好数据的类型(数值?字符串?等等)以及小数点后保留数字的个数即可。
二.选项操作
1. 打开SPSS的“分析”→“降维”→“因子分析”,
打开“因子分析”对话框(如下图)
2. 把六个变量:食品、衣着、燃料、住房、交通和通讯、娱乐教育文化输入到右边的待分析变量框。
3. 设置分析的统计量
打开最右上角的“描述”对话框,选中“统计量”里面的“原始分析结果”和“相关矩阵”里面的“系数”。(选中原始分析结果,SPSS自动把原始数据标准差标准化,但不显示出来;选中系数,会显示相关系数矩阵。)。然后点击“继续”。
打开第二个的“抽取”对话框:“方法”里选取“主成分”;“分析”、“输出”和“抽取”这三项都选中各自的第一个选项即可。然后点击“继续”。
第三个的“旋转”对话框里,选取默认的也是第一个选项“无”。
第四个“得分”对话框中,选中“保存为变量”的“回归”;以及“显示因子得分系数矩阵”。
第五个“选项”对话框,默认即可。
这时点击“确定”,进行主成分分析。
三.分析结果的解读
按照SPSS输出结果的先后顺序逐个介绍
1.相关系数矩阵:是6个变量两两之间相关系数大小的方阵。
2.共同度:
给出了这次主成分分析从原始变量中提取的信息,可以看出交通和通讯最多,而娱乐教育文化损失率最大。
Communalities Initial Extraction 食品 1.000 .878 衣着 1.000 .825 燃料 1.000 .841 住房 1.000 .810 交通和通讯 1.000 .919 娱乐教育文化 1.000 .584
3.总方差的解释:
系统默认方差大于1的为主成分,所以只取前两个,前两个主成分累加占到总方差的80.939%。并且第一主成分的方差是3.568,第二主成分的方差是1.288。
Total Variance Explained Component Initial Eigenvalues Extraction Sums of Squared Loadings Total % of Variance Cumulative % Total % of Variance Cumulative % 1 3.568 59.474 59.474 3.568 59.474 59.474 2 1.288 21.466 80.939 1.288 21.466 80.939 3 .600 10.001 90.941 4 .359 5.975 96.916 5 .142 2.372 99.288 6 .043 .712 100.000 Extraction Method: Principal Component Analysis. 4. 主成分载荷矩阵:
Component Matrixa Component 1 2 交通和通讯 .925 -.252 食品 .902 .255 衣着 .880 -.224 住房 .878 -.195 娱乐教育文化 .588 .488 燃料 .093 .912 应该特别注意:
这个主成分载荷矩阵并不是主成分的特征向量,也就是说并不是主成分1和主成分2的系数,主成分系数的求法是:各自主成分载荷向量除以各自主成分特征值的算术平方根。那么第1主成分的各个系数是向量(0.925, 0.902, 0.880, 0.878, 0.588, 0.093)除以后得到,即(0.490, 0.478, 0.466, 0.465, 0.311, 0.049)(这才是主成分1的特征向量,满足条件:系数的平方和等于1),分别乘以6个原始变量标准化之后的变量即为第1主成分的函数表达式:
同理可以求出第2主成分的函数表达式。(同学们自己求解!)
5. 主成分得分系数矩阵
Component Score Coefficient Matrix Component 1 2 食品 .253 .198 衣着 .247 -.174 燃料 .026 .708 住房 .246 -.152 交通和通讯 .259 -.196 娱乐教育文化 .165 .379 该矩阵是主成分载荷矩阵除以各自的方差得来的,实际上是因子分析中各个因子的系数,在主成分分析中可以不考虑它。
6. 因子得分
在步骤二中,第四个“得分”对话框中,我们选中“保存为变量”的“回归”;以及“显示因子得分系
显示全部