核按钮2017高考数学一轮复习 第十一章 统计 11.4 统计案例习题 理.doc
文本预览下载声明
§11.4 统计案例
1.回归分析(1)回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.(2)线性回归模型用y=bx+a+e表示其中a和b为模型的未知参数称为____________.它的均值满足E(e)=__________(e)=σσ2越小精度越________.(3)在具有线性相关关系的数据(x),(x2,y2),…,(xn,yn)中回归方程的斜率和截距的最小二乘估计公式分别为:
其中=,=(4)残差:=称为相应于点(,)的残差,残差平方和为.
(5)相关指数R2=. R2越大,说明残差平方和,即模型的拟合效果;R2越小,残差平方和,即模型的拟合效果.在线性回归模型中,R2表示解释变量对于预报变量变化的,R2越接近于1,表示回归的效果.
2. 独立性检验
X和Y{x1,x2}和{y1,y2 }2×2列联表)为
y1 y2 总计 x1 a b a+b x2 c d c+d 总计 a+c b+d a+b+c+d K2=___________,
其中n=a+b+c+d为样本容量.
如果K2的观测值k≥k0,就认为“两个分类变量之间有关系”;否则就认为“两个分类变量之间没有关系”.我们称这样的k0为一个判断规则的临界值.按照上述规则,把“两个分类变量之间没有关系”错误地判断为“两个分类变量之间有关系”的概率不超过P(K2≥k0).上面这种利用随机变量K2来判断“两个分类变量有关系”的方法称为___________.
自查自纠误差 0 高 ,)
(4)
(5)1- 越小 越好 越大 越差贡献率 越好
(1)分类变量(2)列联表 独立性检验
r是相关系数则下列叙述中正确的个数为( )[-1-0.75]时两变量负相关很强;[0.75,1]时两变量正相关很强;(-0.75-0.3]或[0.3)时两变量相关性一般;=0.1时两变量相关性很弱.解:|r|越大两变量相关性越强.故选 在回归分析中代表了数据点和它在回归直线上相应位置差异的是( )总偏差平方和 .残差平方和回归平方和 .相关指数R解:残差平方和描述了数据点和它在回归直线上相应位置的差异故选 利用独立性检验来考察两个分类变量X和Y是否有关系时通过查阅下表来确定“X与Y有关系”的可信程度.(K2≥k0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 如果K那么有把握认为“X与Y有关系”的百分数为( )解:∵K而在观测值表中对应于5.024的是有1-0.025=97.5的把握认为“X和Y有关系”.故选 在回归分析中相关指数R的值越大说明残差平方和________.解:R越大残差平方和越小故填越小. 下面是一个2×2列联表 y1 y2 总计 x总计 b 46则表中a处的值分别为________.解:∵a+21=73=52.又∵a+12=b=64.故填52
类型一 回归分析的相关概念 (1)两个变量y与x的回归模型中分别选择了4个不同模型它们的相关指数R如下其中拟合效果最好的模型是( )模型1的相关指数R为0.98模型2的相关指数R为0.80模型3的相关指数R为0.50模型4的相关指数R为0.25解:相关指数越大模型拟合效果越好.故选2)下列四个命题:残差平方和越小的模型拟合的效果越好;用相关指数R来刻画回归效果越小说明模型拟合的效果越好;散点图中所有点都在回归直线附近;随机误差e满足E(e)=0其方差D(e)的大小可用来衡量预报精确度.其中正确命题的个数是( )解:②中R2越大拟合效果越好;③中回归直线同样可以远远偏离变异点;①④正确.注意④是随机变量其故选回归模型的诊断主要是看残差图上、下是否大致均匀分布.另外相关指数R也决定着模型拟合的优劣越大模型拟合效果越好.而随机误差e满足E(e)=0(e)=σσ2越小线性回归模型预报真实值的精度越高. (1)如图的5个数据去掉D(3)后下列错误的是( )
A.相关系数r变大残差平方和变大相关指数R变大解释变量x与预报变量y的相关性变强解:观察可知去掉D(3)后拟合效果更好.因此相关系数变大残差平方和变小相关指数变大解释变量与预报变量的相关性变强.故选B.(2)给出下列结论:回归分析中可用相R2判断模型的拟合效果越大模型的拟合效果越好;回归分析中可用残差平方和判断模型的拟合效果残差平方和越大模型的拟合效果越好;回归分析中可用相关系数r的值判断模型的拟合效果越大模型的拟合效果越好;回归分析中可用残差图判断模型的拟合效果残差点比较均匀地落在水平的带状区域中说明这样的模
显示全部