主成分分析因子分析.ppt
文本预览下载声明
主成分分析 (Principal component analysis) 主成分的定义 从n个观察对象的m个变量中寻找i(i m) 个相互独立并具有特定结构的成分,来反映 原始的 个数据信息的一种多元统计分析 方法。 主成分的数学模型: C=AZ C:主成分向量 A:正交矩阵 Z:原始变量标准化转换后向量 主成分线性组合表达式: 特征根与特征向量 特征根( ):第i个主成分的方差 特征向量:各主成分对应的系数 注:特征根与特征向量是根据原变量相关系数的矩阵计算出来的。 主成分的贡献率 主成分的贡献率 每个特征根占总方差的比例, 越大,表明相应的主成分反映X的信息(“总方差”)就越多。 主成分的累积贡献率 前i个主成分特征根之和占总方差的比例,累积贡 献越大,表明前i个主成分反映了X的信息(“总方差”) 就越多。 Bartlett法: 取有统计学差异的 经验法: 累积贡献率达 (70%、80%、85%、) 均数法: 取大于或者约等于1的 上机内容: 主成分计算 主成分评价 主成分回归 1.主成分计算 见教材p50例4.1 SAS的步骤 ①数据步(data步):略 ②过程步(proc步) PRINCOMP(主成分计算过程) SAS中PRINCOMP过程 Proc princomp 选项; *var 变量列表; 程序4.1 2.主成分评价 步骤: 提取主成分(Proc princomp) 用主成分做评价 第一主成分:排序法 前两个主成分:散点图 前i个主成分:综合得分法 见教材P56例4.4 例4.4的程序 title 主成分评价; data exp4_4; input id $ x1-x16@@; cards; 教青 0.77 1.14 0.19 1.52 0.77 0.19 0.57 0.57 0.19 0.00 0.00 0.19 4.56 0.38 0.38 0.00 . . . . . . . . 工老 1.95 1.30 0.00 0.65 0.00 0.00 0.00 0.00 1.30 0.00 0.00 0.00 1.95 3.24 0.65 0.00 ; proc princomp out=prindata; var x1-x16; run; 例4.4的程序(第一主成分、前i个主成分) title 主成分评价; data exp4_4; input id $ x1-x16@@; cards; 略 ; proc princomp out=prindata; var x1-x16; run; proc print data=prindata; var id prin1 prin2 prin3 prin4; run; 例4.4的程序 title 主成分评价; data exp4_4; input id $ x1-x16@@; cards; 略 ; proc princomp out=prindata; var x1-x16; run; title plot of the first factor and the second factor; proc gplot data=prindata; plot prin2*prin1; run; 3.主成分回归 步骤: 提取主成分(Proc princomp) 选取前i主成分做回归( Proc reg) 见教材p60例4.5 例4.5程序(提取主成分) title 主成分回归; data exp4_5; input x1 x2 x3 y@@; cards; 13.0 9.2 50.0 13.0 . . . . . . . . 49.0 34.8 2500.0 36.0 ; proc princomp out=prindata; var x1-x3; run; 例4.5程序(主成分回归) title 主成分回归; data exp4_5; input x1 x2 x3 y@@; cards; 略 ; proc princomp out=prindata; var x1-x3; run; proc reg outest=prindata; model y=x1 x2 x3/pcomit=1; output; run; proc print data=prindata; run; 因子分析 (facto
显示全部