因子分析与聚类分析案例.doc
文本预览下载声明
因子分析与聚类分析理论简介
因子分析法
因子分析法是一种通过分析多个变量间协方差矩阵(或相关系数矩阵)的内部依赖关系,找出能代表所有变量的少数几个随机变量的计量分析方法。其中,找出的几个随机变量是不可测量的,将其称为公因子。每个公因子之间是互不相关的,所有变量都可以由这几个公因子的线性表示。因子分析通过减少变量的数目,用少数因子代替所有变量去分析整个经济问题,大大简化了现实分析过程。
假设有N个样本,P个指标,是随机向量,需要寻找的公因子是,则将模型
...
称为因子模型。将矩阵称为因子载荷矩阵,将称为因子载荷(Loading),因子载荷的实质是公因子Fi与变量Xj的相关系数。其中,为特殊因子,代表公因子以外的影响因素,在实际分析时一般忽略不计。
对于需要求出的的公因子,其实际含义取决于该公因子在哪些变量上有较大的载荷。但一般情况下,初始因子模型的因子载荷矩阵都比较复杂,不利于因子的解释。因此可进一步通过因子旋转,给出对各公因子更加合理明显的解释。
公因子求出后,可以进一步用回归估计等方法求出各个公因子得分的数学模型,将其表示成变量的线性形式,从而计算求出得分。模型如下:
(i = 1,2,...,m)
层次聚类法
聚类分析的实质是按照距离的远近将数据分为若干个类别,以使得类别内数据的“差异”尽可能小,类别间的“差异”尽可能大。
“差异”的描述是通过距离或相似性的方法来描述。在统计学中最常用的是距离表达式欧几里得距离,对于两条数据和,欧几里得距离的计算公式是:
本文应用的是聚类分析法中的层次分析法,选用的是欧几里得距离的计算方法。
层次分析法通过把距离接近的数据一步一步归为一类,直到数据数据完全归为一个类别为止,再利用一些相应的指标来确定聚为几类的结果是最为合适的。显然,这一系列的聚类结果存在着嵌套,或者说是层次的关系,由于这种结果上的层次关系,整个分析过程,特别是每一步中完成的合并或分割都可以用一张二维空间的图形来表示,这种图被称为“树状图”,是层次聚类法结果解释的重要工具。本文也将利用这一工具对我国商业银行竞争力水平进行研究。
股份制商业银行竞争力的实证分析
样本数据的选取和处理
一、样本选取
本文评价的是我国股份制商业银行的竞争力,以我国国有商业银行和城市商业银行的比较研究得出我国股份制商业银行竞争力的优势与劣势。由于数据选取的局限性(在本文写作过程中,各家商业银行还未全部公布2009年年报),本文数据主要来自于各商业银行的年报数据[44]以及各家银行网站披露相关信息,因此鉴于数据搜集原因,本文采用了2008年的股份制商业银行、国有商业银行和城市商业银行的的数据。同时由于无法获得中国光大银行、广东发展银行、恒丰银行、浙商银行和渤海银行等五家银行的财务报表(这五家股份制商业银行不是上市商业银行,非上市银行披露的数据一般不具有全面性和及时性,真实度也较差),所以本文最终研究的是7家股份制商业银行:中信银行、华夏银行、深圳发展银行、招商银行、上海浦东发展银行、兴业银行、民生银行。同理,本文选取了4家国有商业银行作为比较研究对象:中国工商银行、中国银行、中国建设银行和交通银行。考虑到已上市城市商业银行也具有一定的竞争力,在某些方面有借鉴之处,且代表了城市商业银行的新兴力量,因此将已上市的3家城市商业银行纳入股份制商业银行竞争力对比研究当中,作为比较研究对象,这3家已上市城市商业银行为:北京银行、上海银行、南京银行。
二、指标的标准化
在指标处理前,先要对原始数据标准化,标准化后的变量为Xi,j,即第i个银行的j指标,具体的标准化如下:
对于正指标:
对于逆指标:
其中,正指标与银行竞争力得分呈正相关关系,相应的逆指标与竞争力得分成负相关关系。标准化Tab. 2.1 Common variable degree table
变量 X1 X2 X3 X4 X5 X6 X7 X8 共同度 0.879 0.959 0.872 0.966 0.796 0.973 0.964 0.960 变量 X9 X10 X11 X12 X13 X14 X15 X16 共同度 0.952 0.904 0.905 0.629 0.889 0.908 0.772 0.960 变量 X17 X18 X19 X20 X21 X22 X23 X24 共同度 0.960 0.970 0.977 0.888 0.839 0.946 0.846 0.699 变量 X25 X26 共同度 0.628 0.925
对SPSS软件产生的总方差分析表进行整理,可以得到表 2.2的各因子对原始指标数据的贡献率。
表 2. 2 因子分析特征值及方差贡献率表
Tab. 2.2
显示全部