应用回归大实验..docx
文本预览下载声明
浙江农林大学理学院实 验 报 告所属课程名称 应用回归分析实验时间 2015~2016学年第 一 学期所在实验室 学14408 yao目录1.前言32.问题简述33.多元线性回归34.违背基本假设的情况54.1 异方差性的检验及处理54.2自相关的诊断及处理65.自变量的选择与逐步回归75.1所有子集回归75.2前进法135.3后退法135.4 逐步回归法146.多重共线性的情形及其处理156.1 方差扩大因子法156.2 特征根分析157.岭回归168.总结17附录181.前言前几年全国各地的房价一路攀升,成为了当时经济生活中的一个热点问题,X现在也没有很好的解决房价问题,所以我决定用回归分析中的方法来了解楼房价格。楼房作为一种特殊的商品,在市场上受价值规律影响,其价格主要由商品房本身的价值决定,且价格围绕价值上下波动;当商品房供给大于需求时,其价格下降,反之其价格攀升,这是以简单价值规律的视角得出的结论,一般来说,一个地区的商品房价格是由需求、供给等因素决定的。不论供求关系以及其商品房价值本身如何,房价的变化让普通人难以琢磨,不少专家发表文章称,房地产市场是国家经济走势的晴雨表,是宏观经济疲软或者坚挺的重要标志,这充分说明了房地产市场在国家经济生活中的重要性。我选择了4种可能对商品房价影响的因素(住房竣工面积、商品房销售面积、建筑业贷款、个人住房公积金贷款利率),利用书上的五种方法建立数学模型,得出模型,从而更实际科学的了解房价。2.问题简述考虑商品房的平均价格Y与四个自变量:住房竣工面积X1、商品房销售面积X2、建筑业贷款X3、个人住房公积金贷款利率X4之间的关系。现收集了2003年至2011年共9年的数据,对此数据做回归分析,变量的定义在表1中给出。表1 变量定义变量定义Y平均价格X1住房竣工面积X2商品房销售面积X3建筑业贷款X4个人住房公积金贷款利率3.多元线性回归 多元线性回归模型参数估计的任务有两项:一是求得反映变量之间的数量关系的结构参数的估计量,二是求得随机误差项方差的估计量。表2 Anova模型平方和df均方FSig.1回归4.47441.11942.368.002a残差0.10640.026总计4.588A.预测变量: (常量), x4, x1, x3, x2;B.因变量: y 由表2可知,模型的F值为42.368,P值为0.002,在显著性水平0.05下,模型显著。表3 系数模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)-4.2750.939-4.5550.01X1-0.0010.002-0.11-0.8310.453X20.0060.0010.6565.330.006X30.0870.020.4264.3790.012X41.030.1980.4895.1990.007 由上表可知,我们可以得到的多元回归方程为: 由表1可知:SST=4.580,SSR=4.474,SSE=0.106因此可以得到,即97.686%,R2是判定系数,R=1说明拟合是完全的,R=0说明Y的变化与X无关,实际意义是:在商品房单价取值的变差中,能被商品房竣工面积、商品房销售面积、建筑业贷款、个人住房公积金贷款利率的多元线性回归方程所解释的比例为97.686%。因为这个数值非常接近1,说明其拟合度较高。4.违背基本假设的情况4.1 异方差性的检验及处理图1 残差图 由上图可知,Y的观测值的方差并不相同,而是随着X的增加而增加。表4 相关系数X1X2X3X4abseSpearman 的 rhoX1相关系数10.533.683*-0.455-0.233Sig.(双侧).0.1390.0420.2190.546N99999X2相关系数0.53310.4330.009-0.6Sig.(双侧)0.139.0.2440.9820.088N99999X3相关系数.683*0.4331-0.3760.033Sig.(双侧)0.0420.244.0.3190.932N99999X4相关系数-0.4550.009-0.3761-0.358Sig.(双侧)0.2190.9820.319.0.343N99999abse相关系数-0.233-0.60.033-0.3581Sig.(双侧)0.5460.0880.9320.343.N99999由上表可知,计算丨e丨与Xi的等级相关系数分别为:-0.233,-0.6,0.033,-0.358;Xi的P值都大于0.05,所以不能构造权函数,不存在异方差。 4.2自相关的诊断及处理图2 散点图 从上图可知,绘制et,t的散点图,点都比较散乱,表明随机扰动项不存在序列相关。 表5 模型汇总模型RR 方调整 R 方标准 估计的误差Durbin-Watson1.988a0.9770.9
显示全部