主成分分析理论介绍及举例.ppt
PC2对X阵的贡献T(SPC2*(-0.6998)=)-0.6225-1.56112.39750.4591-0.9488-0.41820.09200.6021B(SPC2*0.7144=)0.63551.5937-2.4475-0.46860.96860.4269-0.0939-0.6147PC2的得分Scores0.88962.2308-3.4260-0.65601.35580.5976-0.1314-0.8604(n-1)xLamda1=PC1得分的平方和(n-1)xLamda2=PC2得分的平方和01Lamda反映的是相应主成分的方差大小02得分的平方和21在该情况下,特征值就是得分的平方和得分与载荷与上例相同例:(17.67)2+(10.58)2+(10.64)2+(4.96)2+(-5.67)2+(-10.61)2+(-12.73)2+(-14.84)2=108943常用的PCAAB得分与载荷与前例不同如果对X不进行预处理,则:PCAPCA在实际计算中,PCA的计算常采用NIPALS(NonlinearIterativePartialLeastSquares)方法NIPALS方法并不是计算所有的因子,仅仅计算最初的k个主成分12以上为8x2的矩阵,可变为2x2的矩阵=======================在实际应用中,对于一个矩阵,Xmxn其每一维的变量都大于2,即m2,n2怎么办?Singlevaluedecomposition因为1X=USVt 即 XV=US2亦即3XV=X[v1,v2,...,vA]==US4可见矩阵US=T(亦称非标准化的得分矩阵)的每一个元素实际是每一个样本向量xit(i=1,2,...,n)对荷载矩阵V中的每一相互正交的荷载矢量上的投影坐标(内积本质上就是投影),它反映了样本与样本之间的相互关系;同理可得,荷载矩阵的每一个元素实际是每一个变量向量xj(j=1,2,...,d)对得分矩阵中的每一相互正交的得分矢量上的投影坐标,它反映了变量与变量之间的相互关系。5主成分分析投影的数学意义主成分分析数学几何意义=投影01主成分分析的数学与几何意义示意图2
PrincipalComponentRegression
(PCR)Emxn01Ymxn02Lambert-BeerLawPCR方法是采用多元统计中的成分分析方法,先对混合物量测矩阵Y矩阵直接进行分解,然后只取其中的主成分来进行回归分析,故有主成分回归之称。方法模型C=PYY=Y0+EY0=U*S*Vt*Y0+=V*(S*)-1Ut*P=CY0+=CV*(S*)-1Ut*C未知=PY未知C,Y分别是浓度矩阵和混合物测量矩阵Y0表示只含混合物的量测值和一部分植入误差矩阵Y0+是Y0的广义逆P是回归系数矩阵U,Vt分别为标准列正交和行正交矩阵,即Scores和LoadingsE为误差矩阵U*,S*,Vt*分别为U,S,Vt的前n个特征值和特征矢量作为主成分,其余作为误差丢弃PCRAdvantagesDoesnotrequirewavelengthselection.Anynumbercanbeused;usuallythewholespectrum,orlargeregions.Largernumberofwavelengthsgivesaveragingeffect,makingmodellesssusceptibletospectralnoise.PCAdatacompressionallowsusinginverseregressiontocalculatemodelcoefficients;cancalibrateonlyforconstituentsofinterest.Canbeusedforverycomplexmixturessinceonlyknowledgeofconstituentsofinterestisrequired.Cansometimesbeus