文档详情

因子分析专题.docx

发布:2019-05-12约6.35千字共21页下载文档
文本预览下载声明
PAGE PAGE 21 因子分析专题 §8.1 引言 因子分析是主成分分析的推广,它也是一种把多个变量化为少数几个综合变量的多元分析方法,其目的是用有限个不可观测的隐变量来解释原始变量之间的相关关系。 例8.1.1 Linden对二次大战以来奥林匹克十项全能比赛的得分做了分析研究,他收集了160组数据,这十个全能项目依次为:100米跑、跳远、铅球、跳高、400米跑、110米跨栏、铁饼、撑竿跳高、标枪、1500米跑。但是总的来说基本上可归结为他们的短跑速度、爆发性臂力、爆发性腿力和耐力这四个方面,每一个方面都称为一个因子。用分别表示十个项目的得分,它们可以表示为含有上述四个因子的线性模型: , 其中表示4个因子,称为公因子,称为第个变量在第个因子上的载荷。 是总平均,是第项得分不能被四个公因子解释的部分,称之为特殊因子。这个模型形式上与线性回归模型几乎一样,但是它们有着本质的区别:回归模型中自变量是可以被观测得到的,而上述因子模型中的是不可观测的隐变量,这使得该模型理解起来较为困难;再者,两个模型的参数意义也很不相同。 例8.1.2 为了评价高中学生将来进大学时的学习能力,抽了200名高中生进行问卷调查,共50个问题。所有这些问题可简单地归结为阅读理解、数学水平和艺术修养这三个方面。这也是一个因子分析模型,每一方面就是一个因子。 例8.1.3 公司老板对48名申请工作的人进行面试,并给出申请人在15个方面所得的分数,这15个方面是:(1)申请信的形式;(2)外貌;(3)专业能力;(4)讨人喜欢的能力;(5)自信心;(6)洞察力;(7)诚实;(8)推销能力;(9)经验;(10)驾驶汽车本领;(11)抱负;(12)理解能力;(13)潜力;(14)对工作要求强烈程度(15)适应性。这些问题可以归结为如下的几个方面:申请者外露的能力,讨人喜欢的程度,申请者的经验,专业能力。每一方面都是因子模型中的一个因子。 §8.2 因子模型 一、数学模型 设维可观测的随机向量的均值为,协方差矩阵为,因子分析的一般模型为 (8.2.1) 其中为公因子,为特殊因子,它们都是不可观测的随机变量。公因子出现在每一个原始变量的表达式中,可理解为原始变量共同具有的公共因素;每个公因子至少对两个原始变量有作用,否则它将归入特殊因子。每个特殊因子仅仅出现在与之相应的第个原始变量的表示式中,它只对这个原始变量有作用。(8.2.1)式可用矩阵表示为 (8.2.2) 式中为公因子向量,为特殊因子向量, 称为因子载荷矩阵,并假设的秩为。通常假定 (8.2.3) 同理易知,注意两个协方差矩阵阶数不一样。 由上述假定可以看出,公因子彼此不相关且具有单位方差,特殊因子彼此不相关且和公因子也不相关。 因子分析与主成分分析是多元分析中两种重要的降维方法,但两者有很大的不同。主成分分析不能作为一个模型来描述,它只能作为一般的变量变换,主成分是可观测的原始变量的线性组合;而因子分析需要构造一个因子模型,公因子一般不能表示为原始变量的线性组合。 二、因子模型的性质 1.的协方差矩阵的分解 由(8.2.2)式知 即 (8.2.4) 这就是的一个分解。如果为标准化了的随机向量,则就是相关矩阵,即有 (8.2.5) 2.模型不受单位的影响 将的单位作变化,就是作一变换,这里,, ,于是,令,,,,则有 (仍然为因子分析模型) 这个模型能满足完全类似于(8.2.3)式的假定,即 其中 即,,。 3.因子载荷是不唯一的 设为任意正交矩阵,令,,则模型(8.2.2)式能表示为 (8.2.6) 因为 所以仍满足条件(8.2.3)式。从(8.2.4)式可以看出,也可分解为 (8.2.7) 因此,因子载荷矩阵不是唯一的,在实际应用中常常利用这一点,通过因子的变换,使得新的因子有更好的实际意义。 三、因子载荷矩阵的统计意义 1.的元素——原始变量与公因子之间的协方差函数 (8.2.1)式可以表示为 , (8.2.8) 故 (8.2.9) 即是与之间的协方差函数。若为标准化了的随机向量,即,则与之间的相关系数 (8.2.10) 此时表示与的相关系数。 2.的行元素平方和——原始变量对公因子依赖的程度 对(8.2.8)式两边取方差 (8.2.11) 令,,于是 , (8.2.12) 反映了公因子对的影响,可以看成是公因子对的方差贡献,称为共性方差;而是特殊因子对的方差贡献,称为个性方差。当为标准化了的随机向量时,,此时有 , (8.2.13) 3.的列元素平方和——公因子对的贡献 由(8.2.11)式
显示全部
相似文档