因子分析的应用.doc
文本预览下载声明
因子分析的应用
摘要:随着我国的经济的发展,人民的生活水平逐渐提高,从而家庭耐用品的拥有量也有所提高。但各省市的拥有量也存在差异,为了准确的把握各省市的情况及其差异,本文采用多变量统计因子分析的方法对其进行定量分析,对各省市的耐用品拥有量的情况有个客观的把握及反映各省市的经济发展情况。
关键字:因子分析,经济发展状况;
1 因子分析的基本定义
1.1 因子分析的基本思想
因子分析的基本思想是根据相关性大小把原始变量分组,使得同组内的变量之间相关性较高,而不同组的变量间的相关性则较低。每组变量代表一个基本结构,并用一个不可观测的综合变量表示,这个基本结构就称为公共因子。对于所研究的某一具体问题,原始变量可以分解成两部分之和的形式,一部分是少数几个不可测的所谓公共因子的线性函数,另一部分是与公共因子无关的特殊因子。
因子分析不见可以用来研究变量之间的相关关系,还可以用来研究样品之间的相关关系,通常将前者称为R型因子分析,后者称为Q型因子分析。
1.2 一般因子分析模型
设有n个样品,每个样品观测p个指标,这p个指标之间有较强大相关性。为了便于研究,并消除由于观测量纲的差异及级数不同所造成的影响,将样本观测数据进行标准化处理,使标准化后的变量均值为0,方差为1.为了方便把原始变量及标准化后的变量向量均用X表示,用F1,F2,...,Fm(mp)表示标准化的公共因子。如果:
(1)X=(X1,X2,...,Fp) 是可观测随机向量,且均值向量E(X)=0,协方差矩阵cov(X)=,且协方差矩阵与相关阵R相等;
(2)F=(F1,F2,...,Fm)(mp)是不可观测的变量,其均值向量E(F)=0,协方差矩阵cov(F)=I,即向量F的各分量是相互独立的;
(3)ε=(ε1,ε2,...,εp)与F相互独立,且E(ε)=0,ε的协方差阵是对角方阵
cov(ε)==
即ε的各分量之间也是相互独立的,则模型
称为因子模型,其矩阵形式为:
X=AF+ε
其中F为公共因子,ε为特殊因子。
而 A=
2 因子分析的实例应用
2.1 数据选用
根据分析用意,为了更好的反映各省市的耐用品拥有量的情况,且根据当今社会家庭拥有耐用品的档次的不同,可将耐用品分为低,中,高三档,从而本文使用2009年统计年鉴的数据。选取了具有代表的三类九个指标:
(一):低档消费耐用品:普通电话拥有量(部);
(二):中档消费耐用品:电冰箱拥有量(台),彩色电视机拥有量(台),空调器拥有量(台),移动电话拥有量(部);
(三):高档奢侈消费耐用品:家用电脑拥有量(台),家用汽车拥有量(辆),摄像机拥有量(台),照相机拥有量(台);
则各地区各种耐用品拥有量如下表1:
表1各地区城镇居民家庭平均每百户耐用消费品拥有量
地区 家用汽车 彩色电视机 家用电脑 摄像机 照相机 空调器 普通电话 移动电话 电冰箱 北 京 29.55 137.63 96.96 21.93 89.35 162.68 100.24 212.67 103.6 天 津 11.86 127.75 79.52 12.29 58.66 129.92 82.62 190.63 107.57 河 北 10.13 118 57.3 5.6 37.69 84.51 75.79 164.43 97.22 山 西 10.03 111.03 49.47 3.95 27.19 33.78 85.24 137.52 86.97 内蒙古 9.51 110.36 43.24 5.95 34.85 10.23 65.18 170.85 94.7 辽 宁 7.23 121.76 60.97 12.97 46.68 29.73 84.1 169.28 97.54 吉 林 5.95 120.58 50.57 6.66 29.65 6.22 69.55 193.89 88.72 黑龙江 3.23 107.6 42.22 5.94 22.18 7.92 72.81 157.69 84.45 上 海 14.04 184.96 123.24 16.02 91.3 196.04 98.52 223.05 104.45 江 苏 11.92 166.75 75.72 7.44 46.39 163.8 110.46 176.2 98.27 浙 江 23.72 181.63 84.53 9.22 47.87 180.05 89.71 191.57 99.23 安 徽 2.76 140.09 56.1 3.45 28.03 110.31 87.81 158.19 96.69 福 建 9.57 175.45 89.15 8.64 43.57 175.36 93.56 216.68 103.91 江 西 4.31
显示全部