文档详情

第五讲-多重共线性、异方差、自相关.ppt

发布:2016-10-22约1.09万字共70页下载文档
文本预览下载声明
一、多重共线性的概念 二、多重共线性的后果 三、多重共线性的诊断 四、克服多重共线性的方法 五、案例 一、多重共线性的概念 2、近似共线性下OLS估计量非有效 如果模型中两个解释变量具有线性相关性,例如 X2= ?X1 , 这时,X1和X2前的参数?1、?2并不反映各自与被解释变量之间的结构关系,而是反映它们对被解释变量的共同影响。 ?1、?2已经失去了应有的经济含义,于是经常表现出似乎反常的现象:例如?1本来应该是正的,结果恰是负的。 多重共线性诊断的任务是: (1)检验多重共线性是否存在; (2)估计多重共线性的范围,即判断哪些变量之间存在共线性。 (1)对两个解释变量的模型,采用简单相关系数法 求出X1与X2的简单相关系数r,若|r|接近1,则说明两变量存在较强的多重共线性。 如果存在多重共线性,需进一步确定究竟由哪些变量引起。 具体可进一步对上述回归方程作F检验: 式中:Rj?2为第j个解释变量对其他解释变量的回归方程的可决系数, 若存在较强的共线性,则Rj?2较大且接近于1,这时(1- Rj?2 )较小,从而Fj的值较大。 因此,给定显著性水平?,计算F值,并与相应的临界值比较,来判定是否存在相关性。 在模型中排除某一个解释变量 X j,估计模型; 如果拟合优度与包含X j时十分接近,则说明X j与其它解释变量之间存在共线性。 (2)逐步回归法 以Y为被解释变量,逐个引入解释变量,构成回归模型,进行模型估计。 根据拟合优度的变化决定新引入的变量是否独立。 如果拟合优度变化显著,则说明新引入的变量是一个独立解释变量; 如果拟合优度变化很不显著,则说明新引入的变量与其它变量之间存在共线性关系。 找出引起多重共线性的解释变量,将它排除出去。 以逐步回归法得到最广泛的应用。 注意: 这时,剩余解释变量参数的经济含义和数值都发生了变化。 时间序列数据、线性模型:将原模型变换为差分模型: ?Yi=?1 ? X1i+?2 ? X2i+?+?k ? Xki+ ? ?i 可以有效地消除原模型中的多重共线性。 多重共线性的主要后果是参数估计量具有较大的方差,所以 采取适当方法减小参数估计量的方差,虽然没有消除模型中的多重共线性,但确能消除多重共线性造成的后果。 例如: 增加样本容量可使参数估计量的方差减小。 六、案例——中国粮食生产函数 根据理论和经验分析,影响粮食生产(Y)的主要因素有: 农业化肥施用量(X1);粮食播种面积(X2) 成灾面积(X3); 农业机械总动力(X4); 农业劳动力(X5) R2接近于1; 给定?=5%,得F临界值 F0.05(5,12)=3.11 F=137.11 3.11, 故认上述粮食生产的总体线性关系显著成立。 但X4 、X5 的参数未通过t检验,且符号不正确,故解释变量间可能存在多重共线性。 发现: X1与X4间存在高度相关性。 可见,应选第1个式子为初始的回归模型。 将其他解释变量分别导入上述初始回归模型,寻找最佳回归方程。 回归方程以Y=f(X1,X2,X3)为最优: 2.自相关产生的原因 大多数经济时间数据都有一个明显的特点,就是它的惯性。 GDP、价格指数、生产、就业与失业等时间序列都呈周期性,如周期中的复苏阶段,大多数经济序列均呈上升势,序列在每一时刻的值都高于前一时刻的值,似乎有一种内在的动力驱使这一势头继续下去,直至某些情况(如利率或课税的升高)出现才把它拖慢下来。 (2)设定偏误1:模型中未含应包括的变量 例如:如果对牛肉需求的正确模型应为 Yt=?0+?1X1t+?2X2t+?3X3t+?t 其中:Y=牛肉需求量,X1=牛肉价格, X2=消费者收入,X3=猪肉价格 如果模型设定为: Yt= ?0+?1X1t+?2X2t+vt 则该式中,vt= ?3X3t+?t, 于是在猪肉价格影响牛肉消费量的情况下,这种模型设定的偏误往往导致随机项中有一个重要的系统性影响因素,使其呈序列相关性。 (3)设定偏误2:不正确的函数形式 例如:如果真实的边际成本回归模型应为: Yt= ?0+?1Xt+?2Xt2+?t 其中:Y=边际成本,X=产出, 但建模时设
显示全部
相似文档