统计回归分析模型解析.doc
文本预览下载声明
一、统计回归分析模型
一、一元线性回归分析
客观世界中普遍存在着变量间的关系,而变量间的关系一般可分为两类:确定性关系和非确定性关系。
1.1一元线性回归模型
设随机变量与普通变量间存在相关关系,且假设对于的每一个取值有
其中、及都是不依赖于的未知参数。记,则对做这样的正态假设,相当于假设
(1)
其中未知参数及都是不依赖于。(1)式称为一元线性回归模型,其中称为回归系数。
(1)式表明,因变量由两部分组成,一部分是的线性函数,另一部分是随机误差,是人不可控制的。
下面的任务是对、的估计。
1.2参数、的最小二乘估计
取的个不全相同的取值,作次独立试验,得到样本
(2)
和样本观测值
(3)
把样本观测值(3)代入(1)得
而使
达到最小为原则对未知参数和的估计称为未知参数和的最小二乘估计,估计值记为和。这时称
为关于的经验回归方程,简称回归方程。其图象称为回归直线。
最终求得和的表达式:
(4)
1.3 习题:
1.为研究某一化学反应过程中,温度对产品得率的影响,测得数据如下:
温度 100 110 120 130 140 150 160 170 180 190 得率 45 51 54 61 66 70 74 78 85 89 求变量关于的线性回归方程。
求的无偏估计。
二、多元线性回归分析
简单线性回归模型主要讨论一个被解释变量与一个解释变量之间的线性关系。在实际经济问题中,由于社会经济现象的复杂性,一个经济变量往往受多个经济变量的影响。例如消费者对某种商品的需求量不仅受收入水平的影响,而且取决于商品价格的高低;又如家庭消费支出不仅与家庭的收入有关,而且与家庭的财富有关。在许多实际问题中,某个因变量随着多个解释变量的变动而作相应的数量变化。因此,有必要将第二章中简单线性回归模型中的一个解释变量情形推广到多个解释变量,利用多元回归方法进行分析。
2.1多元线性回归模型的形式
由于在实际经济问题中,一个变量往往受到多个原因变量的影响;按照“从一般到简单”的建模思路。所以,在线性回归模型中的解释变量有多个。这样的模型被称为多元线性回归模型。多元线性回归模型参数估计的原理与一元线性回归模型相同,只是计算更为复杂。
多元线性回归模型的一般形式为:
其中k为解释变量个数,称为回归系数。
与一元回归分析一样,多元线性回归的总体回归函数表达式为:
在总体回归函数中,由于各参数是未知的,这就需要样本回归函数(SRF):
其中:为截距;为“偏回归系数”,它表示:在其它解释变量不变的情况下,变量每变化一个单位,对Y产生个单位的影响。
2.2多元线形回归模型的矩阵表示
对多元总体回归模型,把常数项看成为一虚变量的系数,该虚变量的样本观测值始终取1。于是,模型中解释变量的数目为(k+1)
矩阵表示:
样本回归函数(SRF)
矩阵表示:
其中
,,
。
比如:二元线性回归模型
。
矩阵表示为:
。
2.3最小二乘估计
基本思想(原则):寻找实际值与拟合值的离差平方和为最小的回归直线。 多元线性回归模型的“残差平方和”为:
要使“残差平方和”达到最小,其充分条件是
有
存在,用左乘方程两边,得参数(向量)的最小二乘估计为:
2.4多元线性回归模型的统计检验
2.4.1拟合优度检验
可决系数(判定系数)
TSS=ESS+RSS
自由度分别为:n-1 k-1 n-k
可决系数(判定系数)为:
可决系数则越靠近1,模型对数据的拟合程度越好。
问题:在应用过程中发现,如果在模型中增加一个解释变量,往往增大(Why?)
这就给人一个错觉:要使得模型拟合得好,只要增加解释变量即可。但是,现实情况往往是,由增加解释变量个数引起的的增大与拟合好坏无关,需调整。
2.4.2例题
某种商品的需求量(,吨)、价格(,元/千克)、和消费者收入(,元)观测值如表所示:
100 5 1000 65 7 400 75 7 600 90 5 1300 80 6 1200 100 4 1100 70 6 500 110 3 1300 50 8 30 60 9 300 要求:
(1) 建立需求函数:;
(2) 估计的置信区间(置信度为95%);
(3) 在5%显著水平上检验模型的有效性。
解:
1)商品的需求量与价格和消费收入的关系为:
相关的检验系数:
模型的经济意义检验:回归系数估计值,表明商品需求量与价格反方向变
显示全部