:线性回归的基本思想:双变量模型.PPT
文本预览下载声明
第二章 线性回归的基本思想: 双变量模型 2.1 回归的含义 回归一词最先由F.加尔顿(Francis Galton)引入 , 在一篇著名的论文中,加尔顿指出,虽然有一个趋势,父母高,儿女也高;父母矮,儿女也矮,但给定父母的身高,儿女辈的平均身高却趋向于或者“回归”到全体人口的平均身高。 K.皮尔逊(Karl Pearson)证实了加尔顿的普遍回归定律 皮尔逊收集过一些家庭群体的1千多名成员的身高记录。他发现,对于一个父亲高的群体,儿辈的平均身高低于他们父辈的身高,而对于一个父亲矮的群体,儿辈的平均身高则高于其父辈的身高。这样就把高的和矮的儿辈一同“回归”到所有男子的平均身高。用加尔顿的话说,这是“回归到中等”。 回归的现代解释 回归分析是关于研究一个叫做应变量(被解释变量)的变量对另一个或多个叫做自变量(解释变量)的变量的依赖关系,其用意在于通过后者的已知或设定值,去估计和(或)预测前者的(总体)均值。 统一符号: Y代表被解释变量(应变量或因变量) X代表解释变量(自变量) 几个简单的例子阐述回归的基本思想 1.加尔顿的兴趣在于发现为什么人口身高分布有一种稳定性。但从现代的观点考虑,我们并不关心这种解释。我们关心的,却是给定父辈身高的情形下找出儿辈平均身高的变化。 2. 经济学家也许想研究个人消费支出对税后或可支配实际个人收入的依赖关系。这种分析会有助于估计边际消费倾向(MPC),就是实际收入每美元价值的变化所引起的消费支出的平均变化。 回归并不意味着存在因果关系! 自变量并不意味是原因 应变量也并不见得是结果 自变量与应变量的关系的判定或推断必须经过实践检验的相关理论 2.1 回归的含义 回归分析的目的: 根据自变量的取值,估计应变量的均值。 检验(建立在经济理论基础之上的)假设。 根据样本外自变量的取值,预测应变量的均值。 可同时进行上述各项分析。 2.2 总体归函数(PRF):假想一例 图2-1 家庭年收入与数学S.A.T分数 2.2 总体归函数(PRF):假想一例 2.2 总体归函数(PRF):假想一例 描出散点图发现:随着收入的增加,成绩“平均地说”也在增加,且Y的条件均值均落在一根正斜率的直线上。这条直线称为总体回归线。 2.2 总体归函数(PRF):假想一例 由于变量间关系的随机性,回归分析关心的是根据解释变量的已知或给定值,考察被解释变量的总体均值,即当解释变量取某个确定值时,与之统计相关的被解释变量所有可能出现的对应值的平均值。严格说,回归分析是条件回归分析(conditional regression annlysis) 2.2 总体归函数(PRF):假想一例 在给定解释变量Xi条件下被解释变量Yi的期望轨迹称为总体回归线(population regression line),或更一般地称为总体回归曲线(population regression curve)。相应的函数: 称为(双变量)总体回归函数(population regression function, PRF)。 2.3 总体回归函数的统计或随机设定 2.4 随机误差项的性质 2.5 样本回归函数 2.5 样本回归函数 2.5 样本回归函数 2.5 样本回归函数 2.6 “线性”回归的特殊含义 我们研究“线性”回归一词是指对参数为线性的一种回归(即参数只以它的1次方出现);对解释变量X则可以是或不是线性的 2.7 从双变量回归到多元线性回归 2.8 参数估计:普通最小二乘法 在回归分析中,使用最广泛、最有效、最流行的方法:普通最小二乘法。 选择B1、B2的估计量b1、b2,使得全部观察值的残差平方和 (RSS) 最小。 2.8 参数估计:普通最小二乘法 2.8 参数估计:普通最小二乘法 2.8 参数估计:普通最小二乘法 2.9 综合应用 对数学S.A.T分数回归结果的解释 2.10 一些例子 例2.3 股票价格与利率 例2.4 美国中等房价与抵押贷款利率(1980-2007) 例2.4 美国中等房价与抵押贷款利率(1980-2007) 例2.5 古董钟与拍卖价格 课堂练习 判断正误并说明理由 随机误差项ui和残差项ei是一回事。 总体回归函数给出了对应于每一个自变量的因变量的值。 线性回归模型意味着变量是线性的。 在线性回归模型中,解释变量是原因,被解释变量是结果。 随机变量的条件均值与非条件均值是一回事。 第2章作业 2.8;2.11;2.16;2.17;2.19;2.21 样本回归函数的随机形式/样本回归模型: 同样地,样本回归函数也有如下的随机形式: 由于方程中引入了随机项,成为计量经济模型,因此
显示全部