文档详情

多元回归概述.ppt

发布:2017-11-10约4.22千字共25页下载文档
文本预览下载声明
7.1.三变量模型 将双变量总体回归模型(PRF)推广为3变量, 即 b1为截距项,按模型的设定可机械地解释为当X2,X3为0时,Y的均值, 隐含的意义为没有包含在模型中的变量对Y的平均影响,系数b2和b3则称为偏回归系数。 模型的假定 0均值 同方差 无序列相关 误差项u与解释变量X不相关 模型无设定偏误 各个解释变量之间无精确的共线性 7.2 多元回归方程的解释 方程表示,在给定回归变量的固定值时,被解释变量的条件期望即总体回归函数。 b2代表了在X3不变的情况下, X2每变化一个单位时,Y的条件均值变化。 b3代表了在X2不变的情况下,X3每变化一个单位时,Y的条件均值变化。 理解偏回归系数:一个儿童死亡率例子 定义变量:Yi表示婴儿死亡率;X2i表示人均GDP;X3i表示女性识字率 假设我们想保持女性识字率不变 第一步:消除Y中X3的影响 理解偏回归系数(续) Y=263.8635-2.390496 X3 + u1 理解偏回归系数(续) 第二步:消除X2中X3的影响 X2 =-39.30328+28.14268 X3 + u2 理解偏回归系数(续) 第三步:用u1对u2回归得到偏回归系数(注意没有截距项) 理解偏回归系数(续) 如果模型误设,含有截距 幸运的是我们并不总是需要这么多个程序 7.5 例子:再次审视婴儿死亡率与人均GDP和女性识字率的关系 定义变量:Yi表示婴儿死亡率(5岁以下,千分数),X2i表示人均GDP, X3i表示女性识字率(%), 为研究这3 个变量之间的关系,设定模型为 Yi =b1+ b2X2i+ b3X3i+ui 人均GDP,应有b20, b30. 例子(续) 估计结果 Yi =263.64-0.0056X2i-2.232X3i 7.6 . 设定误差初探 所谓设定误差,是根据经济学理论,对某个变量(因变量)的行为(或某种理论)应使用多个(如2个)变量予以解释,但研究者却使用较少的变量(如一个)对此变量进行解释,显然反之亦产生设定错误,由此而产生设定错误,称为设定误差. 多元判定系数 R2的注记 问题:上述婴儿死亡率三变量模型,有R2=0.71, 去掉变量X2=人均GDP后, R2=0.67这种减小不能全归结为去掉变量X2 不宜以 最大作为选取模型的标准,回归分析的目的不是获得最大的 ,而是估计和推断总体 对于相同因变量但解释变量的个数和形式不相同的模型,一般可直接比较 7.9. 偏相关系数 对于3变量回归模型 我们已定义Y与X2的相关r12称为简单相关,其中上标1表示因变量,下标表示对应的解释变量。 偏相关系数(续) 对于3元模型,正是由于X3被包含在模型中(隐含了X3与Y的相关且可能与X2也相关)因此,需定义偏相关系数,以度量Y与X2之间的相关 所谓偏相关系数,即是不依赖于X3对X2和X3对Y的影响后,Y与X2之间的相关性,记为 相互关系 * * 第七章 多元回归分析估计问题 7.3 偏回归系数的含义 ?Y ?X3 = ?3 保持 X2 不变, X3 单位变化对Y均值的净影响. 保持不变: 为评价 X2 对 Y变化的影响, 我们必须控制 X3的影响。 Y = ?1 + ?2X2 + ?3X3 + u (假定为实际模型) ?Y ?X2 = ?2 : ?2 度量在保持X3 不变的情况下X2单位变化对Y均值的影响. 或 X2 单位变化对Y均值的“直接”或“净”影响 ˇ ˇ 7.4偏回归系数的OLS估计 OLS 目的是最小化 RSS (? u2) ^ min. RSS = min. ? u2 = min. ?(Y - ?1 - ?2X2 - ?3X3)2 ^ ^ ^ ^ ?RSS ??1 =2 ? ( Y - ?1- ?2X2 - ?3X3)(-1) = 0 ^ ^ ^ ^ ?RSS ??2 =2 ? ( Y - ?1- ?2X2 - ?3X3)(-X2) = 0 ^ ^ ^ ^ ?RSS ??3 =2 ? (Y - ?1- ?2X2 - ?3X3)(-X3) = 0 ^ ^ ^ ^ Y = ?1 + ?2X2 + ?3X3 + u ^ ^ ^ ^ u = Y - ?1 - ?2X2 - ?3X3 ^ ^ ^ ^ 整理三个方程: n?1 + ?2 ?X2 + ?3 ? X3 = ?Y ^ ^ ^ ?2 ?X2 + ?2 ?X32 + ?3 ? X2X3 = ?X2Y ^ ^ ^ ?
显示全部
相似文档