文档详情

《8多重共线性》-课件.ppt

发布:2018-11-07约3.52千字共30页下载文档
文本预览下载声明
* 第8章 多重共线性 multicollinearity 两个或多个解释变量之间存在线性相关,称为多重共线性。 * 多元回归方程古典假设之一: 自变量之间不存在精确的线性关系 即:任何一个解释变量不能写成其他解释变量的线性组合。 * 完全多重共线性 回归模型的某个解释变量可以写成其他解释变量的线性组合。 设X2可以写成其他某些解释变量的线性组合,即: X2=a3X3+ a4 X 4 …+akXk 至少有一个ai≠0,(i= 2,3,…k) 称存在完全多重共线性 * 高度多重共线性 X 2与其他解释变量高度共线性 即可以近似写成其他解释变量的线性组合 X2=a3X3+ a4 X 4 …+akXk +?i 至少有一个ai≠0,(i= 2, 3,…k), vi是随机误差项。 x1 x2 x3 10 50 52 15 75 75 18 90 97 24 120 129 30 150 152 X1与X 2之间有完全共线性,相关系数为1。 X1与X3之间有高度共线性,相关系数为0.9959。 * 多重共线性仅针对解释变量之间的线性关系 解释变量之间可能存在非线性关系。 如:Yi=β1+β2Xi+β3Xi2+β4Xi3+ui 变量X、X2与X3都有函数关系 模型不违反无多重共线性假设。 * 产生多重共线的原因 一、时间序列解释变量受同一因素影响: (1) 经济发展 (2) 政治事件 (3) 偶然事件 (4) 时间趋势 经济变量的共同趋势 例:做电力消费对收入和住房面积的回归 收入较高家庭的住房面积一般地说比收入较低的家庭住房面积大。 * 二、模型设立 解释变量中含有当期和滞后变量 例:投资模型 It=β1+β2rt+β3Yt+β4Yt-1+ut It=投资,rt=利率,Yt=当期GDP,Yt-1=上期GDP 例:消费不仅受当期可支配收入的影响,而且也受前期可支配收入的影响。 产生多重共线的原因 三、样本资料的限制 由于完全符合理论模型所要求的样本数据较难收集,特定样本可能存在某种程度的多重共线性。 一般经验: 时间序列数据样本:简单线性模型,往往存在多重共线性。 截面数据样本:问题不那么严重,但多重共线性仍然是存在的。 * 产生多重共线的原因 * 8.3 多重共线性的后果 1、完全共线性: 参数估计量不存在 参数估计的方差无穷大 * 多重共线的后果 2、近似或高度多重共线性: OLS估计量仍是BLUE 估计量的方差和标准差较大 多个回归系数统计不显著 估计量及标准误对数据的微小变化非常敏感 3、参数估计量经济含义不合理 如果模型中两个解释变量具有线性相关性,例如 X2= ?X1 , 这时,X1和X2前的参数?1、?2并不反映各自与被解释变量之间的结构关系,而是反映它们对被解释变量的共同影响。 ?1、?2已经失去了应有的经济含义,于是经常表现出似乎反常的现象:例如?1本来应该是正的,结果恰是负的。 多重共线性是样本回归现象 1.近似共线性下OLS仍是BLUE,但估计值并不是,可能会与真实值有较大的偏差。 2.近似共线性下样本的方差变大。 3.即使在总体回归模型或函数中不存在共线性,但在某一个样本中可能存在。 * 什么情况下可以无视共线性 1.利用模型对未来的均值进行预测的情形 需要共线性能够持续的保持 2.为了估计出一组系数的关系 3.并不影响单个系数显著性的情形 * 1、多重共线性是一个程度问题,而不是存在与否的问题 2、由于多重共线性针对的是非随机解释变量,因而它是一个样本特征,而不是总体特征 对于非实验数据,无法确定多重共线性的性质和程度,只能利用一些经验法则。 * 8.5 多重共线的诊断 * 多重共线的诊断 1、观察回归结果 R2较高,F很大,但t值显著的不多。 多重共线性的经典特征。 R2较高,F检验拒绝零假设 但各变量的t检验表明,没有(或少有)变量系数是统计显著的 * 多重共线的诊断 2、简单相关系数法 解释变量两两高度相关。 变量相关系数比如超过0.8,则可能存在较为严重的共线性。 这一标准并不总是可靠,相关系数较低时,也有可能存在共线性 3、偏相关系数 4、判定系数法(辅助回归) * 判定系数方法 如果判定系数很大,F检验显著 即Xi与其他解释变量存在多重共线 克莱因的经验法则:当某个辅助回归的R2大于总回归模型中的R2时,多重共线性才算严重。 某个解释变量对其余的解释变量进行回归 * 例:考虑Y对X1、X2、X3、X4、X5和X6 6个解释变量的回归。 找出变量线性组合具体方法: 作6个辅助回归 根据方程的F值判断哪些解释变量是共线性的?
显示全部
相似文档