SAS软件与统计应用教程 教学课件 汪远征 徐雅静 ch6.pdf
文本预览下载声明
SAS软件与统计应用教程 STATSTAT
第六章 主成分分析与因子分析
6.1 主成分分析
6.2 因子分析
SAS软件与统计应用教程 STATSTAT
6.1 主成分分析
6.1.1 主成分分析的概念与步骤
6.1.2 使用INSIGHT模块作主成分分析
6.1.3 使用“分析家”作主成分分析
6.1.4 使用PRINCOMP过程进行主成分分析
SAS软件与统计应用教程 STATSTAT
6.1.1 主成分分析的概念与步骤
1. 主成分分析基本思想
主成分分析是数学上对数据降维的一种方法。其基本
思想是设法将原来众多的具有一定相关性的指标 (比如
p 个指标),重新组合成一组新的互不相关的综合指标
来代替原来指标。通常数学上的处理就是将原来p 个指
标作线性组合,作为新的综合指标。但是这种线性组合,
如果不加限制,则可以有很多,应该如何去选取呢?
SAS软件与统计应用教程 STATSTAT
在所有的线性组合中所选取的F 应该是方差最大的,
1
故称F 为第一主成分。如果第一主成分不足以代表原来
1
p 个指标的信息,再考虑选取F 即选第二个线性组合。
2
为了有效地反映原有信息,F 已有的信息就不需要再出
1
现在F 中,用数学语言表达就是要求Cov(F ,F ) =0 。
2 1 2
称F 为第二主成分,依此类推可以构造出第三、第
2
四、…、第p 个主成分。
SAS软件与统计应用教程 STATSTAT
2. 主成分分析的数学模型
设有n个样品 (多元观测值),每个样品观测p 项指标
(变量):X ,X ,…,X ,得到原始数据资料阵:
1 2 p
x11 x12 ... x1p
x x ... x
X 21 22 2p (X 1 , X 2 ,..., X p )
x x ... x
n 1 n 2 np
其中Xi = (x 1i ,x2i ,…,xni) ,i = 1,2 ,…,p 。
SAS软件与统计应用教程 STATSTAT
用数据矩阵X 的p 个列向量 (即p 个指标向量)X 1 ,
X ,…,X 作线性组合,得综合指标向量:
2 p
+ + +
F a X a X ... a X
显示全部