第八章 成对数据的统计分析 章末题型归纳总结(解析版).docx
第八章成对数据的统计分析
模块一:本章知识思维导图
模块二:典型例题
经典题型一:线性回归方程
经典题型二:非线性回归方程
经典题型三:独立性检验
经典题型四:统计的综合应用
模块三:数学思想方法
①分类讨论思想②转化与化归思想③特殊到一般思想
模块一:本章知识思维导图
模块二:典型例题
经典题型一:线性回归方程
例1.(2023·河南三门峡·高三统考期末)2021年春节前,受疫情影响,各地鼓励外来务工人员选择就地过年.某市统计了该市4个地区的外来务工人数与就地过年人数(单位:万),得到如下表格:
A区
B区
C区
D区
外来务工人数x/万
3
4
5
6
就地过年人数y/万
2.5
3
4
4.5
(1)请用相关系数说明y与x之间的关系可用线性回归模型拟合,并求y关于x的线性回归方程.
(2)假设该市政府对外来务工人员中选择就地过年的每人发放1000元补贴.
①若该市E区有2万名外来务工人员,根据(1)的结论估计该市政府需要给E区就地过年的人员发放的补贴总金额;
②若A区的外来务工人员中甲、乙选择就地过年的概率分别为p,,其中,该市政府对甲、乙两人的补贴总金额的期望不超过1400元,求p的取值范围.
参考公式:相关系数,回归方程中斜率和截距的最小二乘估计公式分别为,.
【解析】(1))由题,,,
,
,
,
所以相关系数,
因为y与x之间的相关系数近似为0.99,说明y与x之间的线性相关程度非常强,所以可用线性回归模型拟合y与x之间的关系.
,,
故y关于x的线性回归方程为.
(2)①将代入,得,
故估计该市政府需要给E区就地过年的人员发放的补贴总金额为(万元).
②设甲、乙两人中选择就地过年的人数为X,则X的所有可能取值为0,1,2,
,
,
.
所以,
所以,
由,得,
又,所以,
故p的取值范围为.
例2.(2023·宁夏吴忠·高二青铜峡市高级中学校考阶段练习)新冠肺炎疫情发生以来,中医药全面参与疫情防控救治,做出了重要贡献.某中医药企业根据市场调研与模拟,得到研发投入x(亿元)与产品收益y(亿元)的数据统计如下:
研发投入x(亿元)
1
2
3
4
5
产品收益y(亿元)
3
7
9
10
11
(1)计算x,y的相关系数r,并判断是否可以认为研发投入与产品收益具有较高的线性相关程度?(若,则线性相关程度一般,若,则线性相关程度较高)
(2)求出y关于x的线性回归方程,并预测研发投入20(亿元)时产品的收益.
参考数据:,,.
附:相关系数公式:,回归直线方程的斜率,截距.
【解析】(1)∵,,,
∴,
∴该中医药企业的研发投入x与产品收益y具有较高的线性相关程度.
(2)∵,
,
∴.
∴y关于x的线性回归方程为,
将代入线性回归方程可得,,
∴预测研发投入20(亿元)时产品的收益为40.3(亿元).
例3.(2023·全国·高二专题练习)共享汽车,是指许多人合用一辆车,即开车人对车辆只有使用权,而没有所有权,有点类似于在租车行业里的短时间的租车.它手续简便,打个电话或通过网上就可以预约订车.某市为了了解不同年龄的人对共享汽车的使用体验,随机选取了100名使用共享汽车的体验者,让他们根据体验效果进行评分.
(1)设消费者的年龄为x,对共享汽车的体验评分为y.若根据统计数据,用最小二乘法得到y关于x的线性回归方程为,且年龄x的方差为,评分y的方差为.求y与x的相关系数r,并据此判断对共享汽车使用体验的评分与年龄的相关性强弱(当时,认为相关性强,否则认为相关性弱).
(2)现将100名消费者的年龄划分为“青年”和“中老年”,评分划分为“好评”和“差评”,整理得到如下数据,请将列联表补充完整并判断是否有99.9%的把握认为对共享汽车的评价与年龄有关.
好评
差评
合计
青年
16
中老年
12
合计
44
100
附:回归直线的斜率
相关系数
独立性检验中的,其中.
临界值表:
0.050
0.010
0.001
3.841
6.635
10.828
【解析】(1)因为,所以,
因为,所以,
因为,所以,
所以相关系数,
因为,所以可以判断对共享汽车使用体验的评分与年龄的相关性很强.
(2)根据题意可得列联表如下:
好评
差评
合计
青年
16
32
48
中老年
40
12
52
合计
56
44
100
因为,
所以有99.9%的把握认为对共享汽车的评价与年龄有关.
例4.(2023·全国·高三专题练习)人工智能教育是将人工智能与传统教育相结合,借助人工智能和大数据技术打造的智能化教育生态.为了解我国人工智能教育发展状况,通过中国互联网数据平台得到我国2015年-2020年人工智能教育市场规模统计图.如图所示,若用x表示年份代码(2015年用1表示,2016年用2表示,依次类推),用y表示市场规模(单位: