实验报告5回归分析.doc
文本预览下载声明
实验五 回归分析SAS过程(2)
实验目的:
1.会对实际问题建立有效的多元回归模型,能对回归模型进行残差分析;
2.掌握SAS输出结果用于判别回归方程优良性的不同统计量,能对回归模型进行运用,对实际问题进行预测或控制.
实验要求:编写程序,结果分析.
实验内容:
1.误差的正态性检验有几种方法,何时认为误差项服从正态分布?
2.回归方程的选取的穷举法中,评价回归方程优良性的准则有哪些?根据准则何
时方程最优?
3.简述逐步回归方法的思想和步骤.
4.做2.6 2.8(选作) 2.9
注意:可以选课外综合题目。
解答过程:
2.6
(1)
由SAS运算结果可以得出:
以下做残差分析:
学生化残差的正态QQ图
拟合值的残差图
结果分析:1) 由学生化残差的正态QQ图可知,其点基本在一条直线上;
2) 求得有序学生化残差与相应正态分布的分位数的相关系数与1比较接近.因此,若拟合线性回归模型,则误差分布与正态分布比较吻合;
3) Y拟合值的残差图也表明与满足线性关系,由此知,直接假定体积与直径和树干高度之间的线性回归关系是合理的。
(2)
对作Box-Cox变换
计算的值.给出了随的变化曲线如下:
求得
由图可知,在时达到最小,因此,在Box-Cox变换式中取.记变换后的因变量为,即
,
其观测值如下:
第二步:对关拟合线性回归模型,利用残差分析考察模型的合理性并做出拟合结果
建立回归模型,作残差分析如下:
对关于拟合线性回归模型,求出残差及学生化残差.做出学生化残差的正态QQ图以及的拟合值的残差图如图所示.
学生化残差的正态QQ图(q, r)
的拟合值的残差图
由图知,线性回归关系高度显著且复相关系数的平方和为,即线性部分描述了的绝大部分变化量.由此得拟合的回归方程为
回归模型残差的相关系数检验
此时可见相关系数为:= 0.98983,因此变换效果比以前更好了。
2.9
(1)
拟合结果:
再做残差分析:
正态QQ图:
的拟合值的残差图
结果分析:i) 由学生化残差的正态QQ图可知,其点基本在一条直线上;
ii) 求得有序学生化残差与相应正态分布的分位数的相关系数与1比较接近.因此,若拟合线性回归模型,则误差分布与正态分布比较吻合;
iii) Y拟合值的残差图也表明与满足线性关系,由此知,模型的正态性假设是合理的。
(2)
(i)修正的准则选择模型结果:
由准则选择最优模型y=(0+(1x1+(2x2+
(ii) 利用准则选择模型结果:
由准则选择最优模型y=(0+(1x1+(3x3+
(iii) PRESSp输出结果:
由上述预测平方和结果看出,的预测平方和PRESSp=2693.43最小,此模型为最终选择的模型
再由上述三种模型的选择结果可以看出各准则下的选择结果不一致。
(3)逐步回归过程:
第一步 1进:样本容量,统计量集,,添加自变量,拟合模型 ,计算,及,结果如下
Y关于的逐步回归的SAS输出结果
依次添加后,的4个模型的输出结果:
第一步中,给出了偏统计量的自由度“DF=1,n-2=23-2=21”,的值和相应的值.由此知,变量所对应值最大,且其值为,故首先进入模型.
接下来拟合以为自变量的回归模型,给出了常数项和的系数估计值和标准差估计,偏统计量的值31.31和检验值,故不能被剔除,当前模型为.
模型y=(0+(1X1的方差分析表
添加X1到模型Z=(0+(1X1后的参数估计表
第二步 第一步选择模型为
2进:将其余3-1=2个自变量逐个添加到此模型中,拟合模型假设, 并计算各自的偏统计量值和相应值,.其中对应值最大,
值,故进入到含回归模型中,得到含为自变量的回归模型,,并给出参数估计值和标准差估计.结果如下:
2出:进一步考查上述模型有无自变量被剔除.拟合模型并计算的偏统计量和的值和值,.由于偏统计量较小, ,故均显著,不能被剔除,当前模型为含的回归模型.程序结果如下:
第三步,第二步选择模型,
3进:对不在模型中的自变量,添加到此模型中,拟合相应模型假设,计算偏统计量
相应的.
由结果, 太小,且,故不能进入到模型中.
程序结果如下
最后由于所有变量都被筛选过,根据筛选和剔除结果最后的最优模型为:
由此可见用逐步回归方法得到的结果与(2)中得到的不一致。
(4)正态QQ图和y的拟合值的残差图如下:
由以上两个图像可以看出线性回归
显示全部