第六章-典型相关分析.pptx
文本预览下载声明
第六章 典型相关分析;第六章 典型相关分析;第一节 典型相关分析的基本原理; 通常情况下,为了研究两组变量
的相关关系,可以用最原始的方法,分别计算两组变量之间的全部相关系数,一共有pq个简单相关系数,这样又烦琐又不能抓住问题的本质。如果能够采用类似于主成分的思想,分别找出两组变量的各自的某个线性组合,讨论线性组合之间的相关关系,则更简捷。
;二、典型相关分析的基本思想;三、典型相关分析的数学描述;四、典型相关分析的应用;第二节 典型变量与典型相关系数的求法;二、原???变理与变型变量之间的相关系数;三、样本典型相关变量和样本典型相关系数;;第三节 典型相关系数的检验;所以,两边同时求行列式,有; 由于
所以若M的特征根为? ,则(l-M)的特征根为(1-?)。根据矩阵行列式与特征根的关系,可得:;在原假设为真的情况下,检验的统计量; 依此类推,再检验下一对典型变量之间的相关性。直至相关性不显著为止。对两组变量x和y进行典型相关分析,采用的也是一种降维技术。我们希望使用尽可能少的典型变量对数,为此需要对一些较小的典型相关系数是否为零进行假设检验。H0经检验被拒绝,则应进一步检验假设。
; 若原假设H0被接受,则认为只有第二对典型变量是有用的;若原假设H0被拒绝,则认为第二对典型变量也是有用的,并进一步检验假设。 ;如此进行下去.直至对某个k;检验的统计量;第四节 典型相关分析的计算步骤; 1、假设有X组和Y组变量,样本容量为n。假设( X1, Y1), ( X2, Y2),…, ( Xn, Yn),观测值矩阵为:
; 2、计算特征根和特征向量
求M1和 M2的特征根 ,对应的特征向量 。则特征向量构成典型变量的系数,特征根为典型变量相关系数的平方。;第五节 邮电业与国民经济的典型相关分析 ;二、数据分析
我们将基于1995年到2007年我国国民经济数据(数据来自于中国统计年鉴),利用Stata软件来做邮电业和国民经济之间的典型相关分析。数据具体见表1. ;;. canon (x1-x4) (y1-y4);. canon (x1-x4) (y1-y4), test(1 2 3 4);用似然比法检验典型相关系数与零的差别是否显著,检验r1时,其零假设为r1以及小于r1的所有典型相关系数都为零;检验时r2,其零假设为r2以及小于r2的所有典型相关系数都为零,依此类推。所求的似然比统计量近似服从F,其P值说明第1和第2典型相关系数分别具有非常显著和显著的意义。;. canon (x1-x4) (y1-y4), stdcoef;从标准化变量出发的典型系数 ,对分析结果进行整理。
样本资料是从1995到2007年,即样本数是13,第一组变量数p=4,第二组变量数q=4。从Stata分析结果看,4个典型相关系数分别为:r1=0.9984,r2=0.9512,r3=0.4436,r4=0.3556. 经似然比检验的结果,前两对典型变量在0.05显著水平下显著相关。
前两对标准化的典型变量的线性组合是:;对结果进行经济意义解释。;. estat loading;. findit canred;. predict u1, u corr(1)
. predict u2, u corr(2)
. predict v1, v corr(1)
. predict v2, v corr(2)
;第五节 利用SPSS进行典型相关分析;数据准备;SPSS中没有现成的菜单可以做典型相关分析,需要使用语法窗口:;;两组变量内部的相关系数:;典型相关系数及其显著性检验:
;典型变量的系数;;典型冗余分析:表示各典型变量对原始变量组整体的变差解释程度。;
显示全部