聚类分析(数据分析).doc
文本预览下载声明
利用相关分析法以及聚类分析对黑龙江省
2009年各市按经济实力分类
目录
摘要: 2
1指标体系的建立 3
1.1数据收集说明 3
1.2 数据的处理 3
1.3指标的解释 3
2相关分析模型的建立 5
2.1 pearson相关系数 5
3聚类分析模型的建立 6
3.1系统聚类分析 6
3.2系统聚类的分析步骤 6
4黑龙江实证分析 7
4.1相关分析 7
4.2 聚类分析 8
总结 10
心得体会 11
参考文献: 12
附录: 13
摘要:
本文是运用了相关分析对黑龙江省13个市2009年的人均GDP、农民人均纯收入、人均社会消费品零售总额、人均财政收入、人均工业增加值、全员劳动生产率、职工平均工资七项指标进行了相关性的检验。然后运用了聚类分析对黑龙江的13个市进行了分类。大致的分为了3大类。
关键词 相关分析;聚类分析;分类;1指标体系的建立
1.1数据收集说明
本次的分析指标是2009年黑龙江13个市的人均GDP、农民人均纯收入、人均社会消费品零售总额、人均财政收入、人均工业增加值、全员劳动生产率、职工平均工资七项。数据经过是从《黑龙江统计年鉴2010》和《中国区域经济统计年鉴2010》上获取的的数据进行相应的计算得到的。
1.2 数据的处理
人均GDP、农民人均纯收入、人均社会消费品零售总额、人均财政收入、人均工业增加值、全员劳动生产率、职工平均工资七项指标中有四项指标是不能直接获取的,分别是:人均社会消费品零售总额、人均财政收入、人均工业增加值和全员劳动生产率。这四项指标通过了一定的计算得到。相应的公式如下:
人均社会消费品零售总额=社会消费品零售总额/年末人口总数;
人均财政收入=财政收入/年末人口总数;
人均工业增加值=工业增加值/年末人口总数;
全员劳动生产率=工业增加值/全部从业人员平均人数;
其中的年末人口总数和全部从业人员平均人数都能在《黑龙江统计年鉴2010》和《中国区域经济统计年鉴2010》中找到。
1.3指标的解释
人均GDP:也叫人均生产总值,常作为发展经济学中衡量经济发展状况的指标。是重要的宏观经济指标之一,它是人们了解和把握一个国家或地区的宏观经济运行状况的有效工具2相关分析模型的建立
2.1 pearson相关系数
相关分析是研究现象之间是否存在某种依存关系研究两个变量间线性关系的程度用相关系数r来描述Pearson相关系数用来衡量两个是否在一条线上面,来衡量定距变量间的线性关系。Pearson|r|0.95,则可以说明这两个变量存在显著性相关;
|r|≥0.8则可以说明这两个变量存在高度相关; 0.5≤|r|0.8则可以说明这两个变量存在高度相关;|0.5≤|r|0.8则可以说明这两个变量存在相关;0.3≤|r|0.5则可以说明这两个变量存在度相关;|r|0.3.则可以说明这两个变量不相关;
3聚类分析模型的建立
3.1系统聚类分析
聚类分析是依据研究对象的特征,对其进行分类的方法,减少研究对象的数目。 各指标之间具有一定的相关关系。
3.2系统聚类的分析步骤
确定待分类的样品的指标
4黑龙江实证分析
4.1相关分析
将数据导入spss后,使用相关中的双相关分析得出如下表格:
相关性 人均GDP 农民人均纯收入 人均社会消费品零售总额 人均财政收入 人均工业增加值 全员劳动生产率 职工平均工资 人均GDP Pearson 相关性 1 .349 .838 .835 .975 .970 .912 显著性(双侧) .000 .000 .000 .000 .000 农民人均纯收入 Pearson 相关性 .349 1 .584 .392 .207 .196 .246 显著性(双侧) .242 .185 .498 .521 .417 人均社会消费品零售总额 Pearson 相关性 .838 .584 1 .789 .711 .695 .793 显著性(双侧) .000 .036 .006 .008 .001 人均财政收入 Pearson 相关性 .835 .392 .789 1 .769 .798 .836 显著性(双侧) .000 .185 .001 .001 .000 人均工业增加值 Pearson 相关性 .975 .207 .711 .769 1 .996 .875 显著性(双侧) .000 .498 .006 .002 .000 全员劳动生产率 Pearson 相关性 .970 .196 .695 .798 .996 1 .884 显著性(双侧) .000 .521 .008 .001 .000 职工平均工资 Pearson 相关性 .912 .246 .793 .836 .875 .88
显示全部