线性回归分析.ppt
感谢大家观看第57页,共57页,2024年2月25日,星期天若pa,拒绝H0,y和x线性关系显著,应保留在方程中;若pa,不能拒绝H0,y和x线性关系不显著。一元线性回归方程的检验和回归系数的检验是等效的。第25页,共57页,2024年2月25日,星期天需要对回归系数是否为零逐一进行检验。原假设H0:βi=0,即:第i个偏回归系数与0无显著差异利用t检验统计量(略)若与t统计量的概率伴随pa,则拒绝H0多元线性回归中回归系数的检验与整体回归方程的检验不能相互替代。二、多元线性方程回归系数的检验第26页,共57页,2024年2月25日,星期天9.3.4残差分析残差指由回归方程计算所得的预测值与实际样本值之间的差距,即模型中εi的估计值:回归模型要求:残差序列中不含明显的规律性和趋势性,均值为零、正态分布、等方差,且序列是独立的。第27页,共57页,2024年2月25日,星期天一、残差均值为零的正态分析可以通过绘制残差散点图来观察:如果残差的均值为零,残差图中的点应在纵坐标为零的横线上下随机散落,如下图。第28页,共57页,2024年2月25日,星期天二、残差的独立性分析(非自相关)残差是独立的,则残差序列应满足cov(εi,εj)=0(i≠j),表示残差序列前期和后期之间不存在相关关系,即不存在自相关。独立性检验方式:第一、绘制残差序列图(下图残差随时间的推移,呈有规律变化,表明残差序列存在一定的正或负自相关)第29页,共57页,2024年2月25日,星期天自相关系数用于测定序列自相关强弱,其取值范围-1~+1,接近1表明序列存在正自相关第二、计算残差的自相关系数第30页,共57页,2024年2月25日,星期天DW检验用于推断小样本序列是否存在自相关的方法。其原假设为:总体自相关系数ρ与零无显著差异。采用统计量为:DW取值在0~4之间:=(-1,0)时,DW=(2,4)残差序列负自相关=0时,DW=2,残差序列无自相关=(0,1)时,DW=(0,2)残差序列正自相关残差存在自相关表明遗漏了解释变量,或变量取值存在滞后性,或线性模型不适合第三、DW(durbin-watson)检验第31页,共57页,2024年2月25日,星期天三、残差异方差分析回归分析要求残差的方差相等,如果存在异方差,则参数的最小二乘估计不再是最小方差的无偏估计。因此需要检验残差是否存在异方差。其方法:第一,绘制残差图(下图残差的方差随解释变量值的增加呈现增加趋势,表明存在异方差)第32页,共57页,2024年2月25日,星期天第二,计算等级相关系数得到残差序列后首先取其绝对值,然后分别计算出残差和解释变量的秩,最后计算spearman等级相关系数,进行等级相关分析。若p值小于给定显著性水平α,则拒绝原假设,认为解释变量与残差间存在显著相关,出现了异方差现象。第33页,共57页,2024年2月25日,星期天9.4多元回归分析中的其它问题9.4.1解释变量的筛选问题多元回归分析中,模型选中应引入多少解释变量呢?少了难以解释对解释变量的变化,多了会引起多重共线。一、向前筛选策略指解释变量不断进入回归方程的策略。首先引入与被解释变量线性相关系数最高的解释变量进入方程,并进行回归方程的各种检验;然后,引入与被解释变量偏相关系数最高并通过检验的解释变量,并对新方程进行各项检验;直到没有可引入的变量为止。第34页,共57页,2024年2月25日,星期天二、向后筛选策略指解释变量不断剔除出回归方程的过程。首先,将所有解释变量引入方程,并检验;然后剔除t检验值不显著(最小)的一个或多个变量,重新建立回归方程并进行各种检验。如果回归系数都显著,则方程建立结束。否则,接着依次删除最不显著的解释变量。三、逐步筛选策略指向前向后筛选的综合策略。在向前筛选过程中,随着变量不断引入方程,需要再次判断是否存在可剔除的解释变量,如有,则剔除。第35页,共57页,2024年2月25日,星期天9.4.2变量的多重共线性问题变量的多重共线:指解释变量之间存在线性相关关系的现象。若存在多重共线,则会造成偏回归系数估计困难、估计的方差增大、估计值的不稳定性增强、偏回归系数假设检验的结果不显著等问题。测度多重共线的方法如下:第36页,共57页,2024年2月25日,星期天一、容忍度解释变量xi的容忍度:Toli=1-Ri2,其中:Ri2是解释变量xi与方程中其他解释变