文档详情

(第10章《概率、统计与统计案例》回归分析与独立性检验.ppt

发布:2016-11-02约2.21千字共17页下载文档
文本预览下载声明
新 课 标 资 源 网 老 师 都 说 好 ! 学案8 回归分析与独立性检验 返回目录 1.随机误差 由于所有的样本点不共线,而只是散布在某一条直线的附近,实际上,y=bx+a+e,e是y与 =bx+a之间的误差.通常e为随机变量,称为随机误差,它的均值E(e)=0,方差D(e)=σ20.这样线性回归模型的完整表达式为 . y=bx+a+e E(e)=0,D(e)=σ2 返回目录 随机误差e的方差σ2越小,通过回归直线 =bx+a预报真实值y的精确度越高.随机误差是引起预报值 与真实值y之间的误差的原因之一,其大小取决于随机误差的方差. 2.残差 对于样本点(x1,y1),(x2,y2),…,(xn,yn)而言,相应于它们的随机误差为ei=yi-yi=yi-bxi-a,i=1,2,…,n, 其估计值为ei= = ,i=1,2,…,n,ei称为相应于点(xi,yi)的残差. 3.残差分析 在研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否线性相关,是否可以用线性回归模型来拟合数据.然后,可以通过残差e1,e2,…,en来判断模型拟合的效果,判断原始数据中是否存在可疑数据.这方面的分析工作称为残差分析. 4.残差图 作图时纵坐标为残差,横坐标可以选为样本编号,这样作出的图形称为残差图. 返回目录 5.列联表 假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表为 此表称为2×2列联表. 根据观测数据计算由公式 . 给出的检验随机变量K2的值k,其值越大,说明“X与Y有关系”成立的可能性越大. y1 y2 总计 x1 a b a+b x2 c d c+d 总计 a+c b+d 返回目录 (其中n=a+b+c+d为样本容量) a+b+c+d 返回目录 考点一 相关与无关的判定 每立方米混凝土的水泥用量x(单位:kg)与28天后混凝土的抗压强度Y(单位:kg/cm2)之间的关系有如下数据: X 150 160 170 180 190 200 210 220 230 240 250 260 Y 56.9 58.3 61.6 64.6 68.1 71.3 74.1 77.4 80.2 82.6 86.4 89.7 返回目录 【分析】 求回归直线方程和相关系数, 通常用计算器来完成.在有的较专门的计算器中,可通过直接按键得出回归直线方程的系数和相关系数 .而如果用一般的科学计算器进行计算 ,则要先列出相应的表格 ,有了表格中的相关数据 ,回归方程中的系数和相关系数都容易求出. (1)对变量Y与x进行相关性检验; (2)如果Y与x之间具有线性相关关系,求回归直线方程. 【解析】(1)由题目中的数据得如下表格: i 1 2 3 4 5 6 xi 150 160 170 180 190 200 yi 56.9 58.3 61.6 64.6 68.1 71.3 xiyi 8535 9328 10472 11628 12939 14260 i 7 8 9 10 11 12 xi 210 220 230 240 250 260 yi 74.1 77.4 80.2 82.6 86.4 89.7 xiyi 15561 17028 18446 19824 21600 23322 返回目录 返回目录 查得r0.05=0.576, 因r>r0.05,说明变量Y与x之间具有线性相关关系. 【评析】为了进行相关性检验,通常将有关数据 列成表格,然后借助于计算器算出各个量,为求回归 直线方程扫清障碍. 返回目录 (2) a=y-bx=10.28. 于是所求的线性回归方程是: =0.304x+10.28. *对应演练* 在10年期间,一城市居民的年收入与某种商品的销售额之间的关系有如下数据: 返回目录 第几年 1 2 3 4 5 城市居民年收入(亿元) 32.2 31.1 32.9 35.8 37.1 某商品销售额(万
显示全部
相似文档