8.2 一元线性回归模型及其应用(五大题型)(原卷版).docx
8.2一元线性回归模型及其应用
【题型归纳目录】
题型一:求回归直线方程
题型二:利用回归直线方程对总体进行估计
题型三:线性回归分析
题型四:残差分析与相关指数的应用
题型五:非线性回归分析
【知识点梳理】
1、一元线性回归模型
我们称为关于的一元线性回归模型,其中称为因变量或响应变量,称为自变量或解释变量;和为模型的末知参数,称为截距参数,称为斜率参数;是与之间的随机误差.
2、线性回归方程与最小二乘法
回归直线方程过样本点的中心,是回归直线方程最常用的一个特征
我们将称为关于的线性回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线.这种求经验回归方程的方法叫做最小二乘法,求得的叫做b,a的最小二乘估计(leastsquaresestimate),
其中
3、残差的概念
对于响应变量,通过观测得到的数据称为观测值,通过经验回归方程得到的称为预测值,观测值减去预测值称为残差.残差是随机误差的估计结果,通过残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.
4、刻画回归效果的方式
(1)残差图法
作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图.若残差点比较均匀地落在水平的带状区域内,带状区域越窄,则说明拟合效果越好.
(2)残差平方和法
残差平方和,残差平方和越小,模型拟合效果越好,残差平方和越大,模型拟合效果越差.
(3)利用刻画回归效果
决定系数是度量模型拟合效果的一种指标,在线性模型中,它代表解释变量客立预报变量的能力.,越大,即拟合效果越好,越小,模型拟合效果越差.
【典型例题】
题型一:求回归直线方程
例1.(2023·四川成都·高二校考期末)某城市2017年到2021年人口总数与年份的关系如表所示,据此估计2022年该城市人口总数______(单位十万).(参考数据和公式:,)
年份(年)
0
1
2
3
4
人口数(十万)
5
7
8
11
19
例2.(2023·高三课时练习)某实验室对小白鼠体内x、y两项指标进行研究,连续五次实验所测得的这两项指标数据如下表:
x
120
110
125
130
115
y
92
83
90
96
89
已知y与x具有线性相关关系,利用上表中的五组数据求得回归直线方程为.若下一次实验中,利用该回归直线方程预测得,则的值为______.
例3.(2023·上海·高三专题练习)已知由样本数据组成的一个样本,得到回归直线方程为,且,其中发现两个歧义点和偏差过大,去除这两点后,得到新的回归直线的斜率为3,则新的回归直线方程为______________.
变式1.(2023·高三课时练习)某研究机构对高三学生的记忆力和判断力进行统计分析,得表数据,
6
8
10
12
2
3
5
6
请根据表提供的数据,求出关于的线性回归方程:__.
变式2.(2023·广西北海·高二统考期末)某工厂节能降耗技术改造后,在生产某产品过程中记录的产量x(吨)与相应的生产能耗y(吨)的几组对应数据如下表,现发现表中有个数据看不清,已知回归直线方程为,则看不清的数据★的值为__________.
x
2
3
4
5
6
y
19
25
★
40
44
题型二:利用回归直线方程对总体进行估计
【方法技巧与总结】
求线性回归方程的一般步骤
(1)收集样本数据,设为(数据一般由题目给出).
(2)作出散点图,确定x,y具有线性相关关系.
(3)把数据制成表格.
(4)计算.
(5)代入公式计算,公式为
(6)写出线性回归方程.
例4.(2023·四川雅安·高二统考期末)某连锁经营公司所属5个零售店某月的销售额和利润额资料如表.
商店名称
A
B
C
D
E
销售额x(千万元)
3
5
6
7
9
利润额y(千万元)
2
3
3
4
5
(1)若销售额和利润额具有相关关系,用最小二乘法计算利润额y对销售额x的回归直线方程.
(参考公式,)
(2)若该公司计划再开一个店想达到预期利润为8百万,请预估销售额需要达到多少?
例5.(2023·陕西西安·统考一模)偏差是指个别测定值与测定的平均值之差,在成绩统计中,我们把某同学的某科考试成绩与该科平均成绩的差叫某科偏差(实际成绩-平均成绩=偏差).在某次考试成绩统计中,教研人员为了对学生数学偏差x(单位:分)与物理偏差y(单位:分)之间的关系进行分析,随机挑选了8位同学,得到他们的两科成绩偏差数据如下:
学生序号
1
2
3
4
5
6
7
8
数学偏差x/分
20
15
13
3
2
物理偏差y/分
6.5
3.5
3.5
1.5
0.5
(1)若x与y之间具有线性相关关系,求y关于x的线性回归方程;
(2)若本次考试数学平均成绩为100分,物理平均