多元统计分析关于各地区住宿业企业基本情况和经营情况的统计分析论文.doc
文本预览下载声明
关于各地区住宿业企业基本情况和经营情况的统计分析
班级:统计一班
姓名:
学号:201010060106
指导教师:高艳
摘要:
关键词:
住宿业 营业额 频数分析 因子分析 聚类分析 判别分析
正文:
序言:
正文:
第一步、录入数据:
图-1
图-2
第二步、进行频数分析:
表-1
统计量 法人企业(个) 年末从业人数(人) 营业额(亿元) 客房收入 餐费收入 N 有效 31 31 31 31 31 缺失 0 0 0 0 0 均值 506.87 68005.77 90.253 42.250 36.899 中值 423.00 56088.00 54.669 25.676 24.175 标准差 370.251 59799.092 93.3595 43.5005 37.8579 方差 137086.116 3.576E9 8715.988 1892.295 1433.219 偏度 1.296 2.272 1.892 1.895 1.886 偏度的标准误 .421 .421 .421 .421 .421 峰度 1.624 7.040 3.405 3.219 3.578 峰度的标准误 .821 .821 .821 .821 .821 百分位数 25 234.00 26098.00 30.930 15.178 12.916 50 423.00 56088.00 54.669 25.676 24.175 75 654.00 87962.00 98.731 47.758 44.373 表-1为统计量表,从上表中可以看出各个变量的均值、中值、标准差、方差、偏度、峰度、以及它们的标准误差,法人企业的营业额基本上是由客房收入和餐费收入平摊,但相对来说还是客房收入占得比例较大些。
图-3
图-3为带有正态曲线的直方图,描述的是法人企业个数的方面的问题,从图中可以看到各个城市的平均法人个数为506.87,标准误差为370.251,总共有31个城市,而且在这些城市中,法人企业个数在250个的城市居多,大约占到九个。根据标准正态曲线,可以看出该变量的变化情况可大致认为服从正态分布,但在后面的部分也还是存在一定的偏差。
图-4
图-5
图-6
图-7
图-4、图-5、图-6、图-7分别表示的是年末从业人数、营业额、客房收入和餐费收入的频数直方图,分析方法和图-3相似,就不一一分析了,从上面几个图中可以看出,这几个变量都大致服从正态分布,但我国住宿业方面的发展还是很不平衡,无论是从这五个方面的哪一方面来看,都是数值小的占的比例较大。说明只有少数地区的住宿业可以达到发达水平,还有大部分地区需要加大力度来提高自己的收入水平。
第三步、对数据进行因子分析:
表-2
相关矩阵 法人企业(个) 年末从业人数(人) 营业额(亿元) 客房收入 餐费收入 相关 法人企业(个) 1.000 .964 .932 .891 .945 年末从业人数(人) .964 1.000 .956 .919 .968 营业额(亿元) .932 .956 1.000 .988 .968 客房收入 .891 .919 .988 1.000 .923 餐费收入 .945 .968 .968 .923 1.000 表-2为五个变量的相关矩阵,从表中的数据可以看出,各个变量同其他变量之间的相关性都很强。
表-3
解释的总方差 成份 初始特征值 提取平方和载入 合计 方差的 % 累积 % 合计 方差的 % 累积 % 1 4.782 95.648 95.648 4.782 95.648 95.648 2 .140 2.795 98.443 3 .049 .982 99.426 4 .027 .550 99.975 5 .001 .025 100.000 提取方法:主成份分析。 表-3为解释的总方差,可以看到只要第一个成分就可以解释95.648%的信息,而且在合计列中只有第一个因子的特征值大于1,所以我提取了第一个变量因子并对它做因子分析。
图-8
图-8为因子分析的碎石图,从图中可以明显的看到第一段的斜率很大,而后面就变得平缓了,也说明只要一个因子就能很好地解释所有的变量,说明我们只提取一个因子的做法是合理的。但由于只有一个因子,所以无法得到因子载荷矩阵和旋转的因子载荷矩阵,但可以有成分得分系数矩阵,由此可以算出因子得分。
表-4
成份得分系数矩阵 成份 1 法人企业(个) .202 年末从业人数(人) .206 营业额(亿元) .207 客房收入 .202 餐费收入 .205 提取方法 :主成分
显示全部