文档详情

第八讲 非线性回归.ppt

发布:2019-05-06约3.9千字共71页下载文档
文本预览下载声明
非线性回归函数 线性回归的最大特点是:总体回归函数的斜率为常数。故X变化一个单位对Y的效应不依赖于X本身的取值。 我们今天研究的非线性回归中,总体回归函数的斜率不再是常数,X的变化对Y的效应依赖于一个或多个自变量的取值。 非线性回归函数的一般建模方法 我们考虑测试成绩和地区收入的关系 二次回归模型 在stata中需要用gen命令产生一个新的变量表示:Income2。 gen income2=income^2 reg TestScore income income2 如何决定是用线性还是非线性? 最简单的办法是利用t检验考察二次方的显著性: 对于方程 我们需要检验income2前的系数β2是否显著。 非线性设定形式中X变化对Y的效应 想知道在固定其他自变量X2、X3…Xk的情形下,当自变量X1变化?X时,预期因变量Y如何变化。当总体回归函数为线性时,很容易计算这个效应, ?Y=?1?X1 但当回归函数为非线性时,由于Y的预期变化依赖于自变量的取值,因此其计算较复杂。 书中的两个例子 1。地区收入从10----11(单位是千美元) 2。地区收入从40----41 效应估计的标准误差 利用多元回归建立非线性模型的一般方法 (1)确定一种可能的非线性关系。最佳做法是利用经济理论和你对实际应用的了解提出一种可能的非线性关系。在看数据之前,问自己联系Y和X的回归函数斜率是否依赖于X或其他自变量的取值。 (2)确定一个非线性函数并用OLS估计其参数。后续章节将会学习多种非线性函数形式。 (3)确定非线性模型是否改进了线性模型。大多数情况下可以利用t统计量和F统计量来检验总体回归函数是线性的原假设和非线性的备择假设。 (4)画出非线性回归函数估计图。(线性拟合图)。 (5)利用前面讲的公式估计X变化对Y的效应。 非线性函数的形式 常用的多项式函数: r=2 二次回归模型 r=3 立方回归模型 是否需要多项式函数 到底应该采用几阶多项式 1。最直观的办法是画散点图。 2。很多涉及经济数据的应用中,非线性函数都是光滑的,也就是不存在急剧的跳跃或“尖峰”。则选择较小的多项式最高阶数,如2, 3或4较合适。 (3)如果在步骤(2)中不能拒绝?r =0,则从回归中剔除Xr并估计r-1阶多项式回归。接着检验Xr-1的系数是否为零。如果拒绝则使用r-1阶多项式。 (4)如果在步骤(3)中不能拒绝?r-1 =0 ,重复这一步直到回归中最高次方的系数统计显著为止。 例一 例二 在工资方程中,建立ln(wage)与exper的多项式关系。 对数形式 对数形式经常用于表示变量的百分率变化。例如: 在消费者需求的经济分析中,通常假定价格上涨1%导致需求量下降一定的 百分率。称价格上涨1%引起的需求下降百分率为价格弹性(elasticity)。 对数形式是经济学中最常用的形式,广泛地应用在各个领域中: 例如:在宏观经济学中,我们如果想研究投资的增 长率,通常用 表示,其中 一般可以表达为: 三种对数回归模型 例子 书中的两个例子 1。地区收入从10----11(单位是千美元) 2。地区收入从40----41 注意:因为自变量不包含任何对数形式,所以对数线性模型的拟合图是一条直线。 双对数函数最典型的例子是生产函数production。 测试成绩和地区收入的多项式和对数模型 挑选一种最好的函数形式: 到底选择多项式还是对数? 在多项式和对数中哪种形式最好? 多项式和对数的组合效果如何? 1。多项式形式 立方和线性对数形式的比较 因为是线性对数,所以可以比较adj R2。由于本题线性对数较高,所以采用线性对数形式。 自变量的交互作用(交乘项) 解释变量之间往往不是相互独立的,当两个解释变量之间相互影响,对被解释变量具有交互作用时,往往引入交乘项。即某个自变量变化对Y的效应依赖于另一个自变量取值。 我们将分三种情况考虑: 1。两个自变量都是虚拟变量; 2。一个自变量是虚拟变量而另一个是连续变量; 3。两个变量都是连续变量。 两个虚拟变量的交互作用 按照上,固定性别时,无论男性女性,拥有大学学位的效应是一样的。但现实情况是,在劳动市场中文凭的价值对男性和女性而言是不同的。 显然,上述形式没有考虑到性别和获得大学学位的交互作用,因此我们引入一个交乘项D1*D2进行修正。 分析: 1。给定D1的取值,D2=0 和D2=1的数学期望为: E(Y|D1=d1,D2=0)=β0+β1d1 E(Y|D1=d1,D2=1)=β0+β1d1+ β2+β3d1 第二项减去第一项,得β2+β3d1 这是大学毕业生和非大学毕业生对Y的影响效应之差。但我们发现,这种效应依赖于
显示全部
相似文档