文档详情

八章因子分析.ppt

发布:2017-04-07约1.17万字共56页下载文档
文本预览下载声明
第八章 因子分析 §8.1 引言 §8.2 正交因子模型 §8.3 参数估计 §8.4 因子旋转 §8.5 因子得分 1 §8.1 引言 (本身作为目的的)主成分分析的成功需满足如下两点: (1)前(少数)几个主成分具有较高的累计贡献率; (通常较易得到满足) (2)对主成分给出符合实际背景和意义的解释 。 (往往正是主成分分析的困难之处) 因子分析的目的和用途与主成分分析类似,它也是一种降维方法。由于因子往往比主成分更易得到解释,故因子分析比主成分分析更容易成功,从而有更广泛的应用。 2 因子分析起源于20世纪初,K.皮尔逊(Pearson)和C.斯皮尔曼(Spearman)等学者为定义和测定智力所作的努力,主要是由对心理测量学有兴趣的科学家们培育和发展了因子分析。 因子分析与主成分分析主要有如下一些区别: (1)主成分分析涉及的只是一般的变量变换,它不能作为一个模型来描述,本质上几乎不需要任何假定;而因子分析需要构造一个因子模型,并伴有几个关键性的假定。 (2)主成分是原始变量的线性组合;而在因子分析中,原始变量是因子的线性组合,但因子却一般不能表示为原始变量的线性组合。 3 4 (3)在主成分分析中,强调的是用少数几个主成分解释总方差;而在因子分析中,强调的是用少数几个因子去描述协方差或相关关系。 (4)主成分的解是惟一的(除非含有相同的特征值或特征向量为相反符号);而因子的解可以有很多,表现得较为灵活(主要体现在因子旋转上),这种灵活性使得变量在降维之后更易得到解释,这是因子分析比主成分分析有更广泛应用的一个重要原因。 (5)主成分不会因其提取个数的改变而变化,但因子往往会随模型中因子个数的不同而变化。 5 例8.1.1 林登(Linden)根据他收集的来自139名运动员的比赛数据,对第二次世界大战以来奥林匹克十项全能比赛的得分作了因子分析研究。这十个全能项目是: x1:100米跑 x6:11米跨栏 x2:跳远 x7:铁饼 x3:铅球 x8:撑杆跳高 x4:跳高 x9:标枪 x5:400米跑 x10:1500米跑 经标准化后所作的因子分析表明,十项得分基本上可归结于他们的爆发性臂力强度、短跑速度、爆发性腿部强度和跑的耐力这四个方面,每一方面都称为一个因子。十项得分与这四个因子之间的关系可以描述为如下的因子模型: xi=μi+ai1f1+ai2f2+ai3f3+ai4f4+εi, i=1,2,?,10 其中f1, f2, f3, f4表示四个因子,称为公共因子(common factor), 6 aij称为xi在因子fj上的载荷(loading),μi是xi的均值,εi是xi不能被四个公共因子解释的部分,称之为特殊因子(specific factor)。 例8.1.3 公司老板对48名应聘者进行面试,并给出他们在15个方面所得的分数,这15个方面是: x1:申请书的形式 x9:经验 x2:外貌 x10:积极性 x3:专业能力 x11:抱负 x4:讨人喜欢 x12:理解能力 x5:自信心 x13:潜力 x6:精明 x14:交际能力 x7:诚实 x15:适应性 x8:推销能力 通过因子分析,这15个方面可以归结为应聘者的进取能干、经验、讨人喜欢的程度、专业能力和外貌这五个因子。 7 §8.2 正交因子模型 一、数学模型 二、正交因子模型的性质 三、因子载荷矩阵的统计意义 8 一、数学模型 设有p维可观测的随机向量 ,其均值为 ,协差阵为Σ=(σij)。因子分析的一般模型为 其中f1, f2,?, fm为公共因子,ε1, ε2,?, εp为特殊因子,它们都是不可观测的随机变量。公共因子出现在每一个原始变量的表达式中,可理解为原始变量共同具有的公共因素。上式可用矩阵表示为 x=μ+Af+?? 9 式中 为公共因子向量, 为特殊因子向量, 称为因子载荷矩阵。通常假定 该假定和上述关系式构成了正交因子模型。由上述假定可以看出,公共因子彼此不相关且具有单位方差,特殊因子也彼此不相关且和公共因子也不相关。 10 二、正交因子模型的性质 1. x的协差阵Σ的分解 2.模型不受单位的影响 3.因子载荷是不惟一的 11 1. x的协差阵Σ的分解 Σ
显示全部
相似文档