第2章_一些基本概念计量经济学-古扎拉蒂教学.ppt
文本预览下载声明
第二章 回归分析的一些基本概念 安立仁 2.1条件概率与条件期望 条件概率:p(Y=Yj|X=Xi)=p 条件期望:E(Y|X=Xi) 总体回归曲线就是解释变量取给定值时应变量的条件均值或期望值的轨迹。 一个例子 总体回归线 2.2总体回归函数(Population Regression Function)的概念 每一条件值E(Y|Xi)都是Xi的一个函数,即: 2.3“线性”的含义 对变量为线性 Y的条件期望值是Xi的线性函数,即 E(Y|Xi)=?1+?2Xi 对参数为线性 “线性”回归一词总是指对参数?为线性的一种回归;对解释变量X则可以是或不是线性的。(与以往的线性概念有所不同) 2.4PRF的随机设定 给定收入水平Xi的个别家庭的消费支出聚集在收入为Xi的所有家庭的平均消费支出的周围,也就是围绕着它的条件均值。可以把个别的Yi围绕它的期望的离差表述如下: 2.5随机干扰项的意义 什么是随机干扰? 干扰项是从模型中省略掉的而又集体地影响着Y的全部变量的替代物。 干扰项产生的来源是多方面的: 理论的含糊:除了主变量之外,还有其它变量的影响,但不清楚,无法进入模型。 数据的不充分:可能知道被忽略的变量,但不能得到这些变量的数量信息。 核心变量与其它变量:其它变量全部或其中一些合起来影响还是很小的。 人类行为的内在随机性 替代变量不好:测量误差 节省原则:为了保持一个尽可能简单的回归模型 错误的函数形式:有时根据数据及经验无法确定一个正确的函数形式 2.6样本回归函数(SRF) 总体与样本 总体特征值是一常数称为参数 样本特征值是一变数称为估计量或统计量 总体的两个不同的随机样本 样本1的与样本2的图象 对于上表的数据 这些数据说明什么? 与工薪水平的关系最为密切的是年龄,还是经验?你怎样知道? 分开画两个图,一个以表示工薪的中位数同年龄的关系,另一个表示工薪的中位数同专业经验(以年计)的关系. 2.7讨论问题 参数与估计量之间的关系 参数是已知的还是未知的?一般而言参数可知吗? 全国人口普查得到的中国人口有关数据的特征值是统计量还是参数? * 1211 966 1043 685 750 678 707 445 462 325 合计 173 161 149 137 125 113 101 89 77 65 191 — 162 — — — 115 — — — 185 189 160 — 140 125 113 — 88 — 180 175 157 145 135 118 108 98 85 75 178 165 152 144 130 116 103 94 80 70 175 155 140 140 120 110 95 90 74 65 152 145 137 136 115 107 93 84 70 60 150 137 135 120 110 102 80 79 65 55 每周家庭消费支出 260 240 220 200 180 160 140 120 100 80 X Y X,每周家庭收(美元) 100 160 260 173 113 77 每周消费支出(美元) 每周收入(美元) X Y 注意总体二字。回归系数 对于线性的回归方程 样本回归与总体回归的比较P31 260 175 260 150 240 145 240 155 220 135 220 140 200 145 200 120 180 120 180 115 160 118 160 110 140 80 140 95 120 90 120 90 100 88 100 65 80 55 80 70 X Y X Y 随机样本2 随机样本1 Xt X A Y Yt 每周消费支出(美元) 每周收入(美元) 样本与总体回归线的比较 12.5 70-74* 17.0 13.8 65-69 18.8 17.2 16.0 13.1 60-64 19.0 18.0 16.0 13.8 55-59 20.0 18.2 15.0 13.3 11.3 50-54 20.0 17.0 15.0 12.0 45-49 17.0 15.5 13.0 11.0 9.6 40-44 15.0 13.2 11.7 10.0 35-39 12.6 11.0 9.5 9.0 30-34 10.0 9.1 9.0 25-29 7.5 20-24 40-44! 35-39 30-34 25-29 20-24 15-19 10-14 5-9 2-4 0-2 年龄 专业经验的年数 72 67 62 57 52 47 42 37 32 27 22 年龄中位 12.5 70-74* 15.4 65-69 16.6 60-64 17.0 55-59 15.0
显示全部