2025高考数学二轮专题复习专题五概率与统计微专题3统计与成对数据的统计分析 .docx
微专题3统计与成对数据的统计分析
[考情分析]高考对本讲内容的考查往往以实际问题为背景,考查随机抽样与用样本估计总体、经验回归方程的求解与运用、独立性检验问题,常与概率综合考查,中等难度.
考点一统计图表、数字特征
1.频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示频率组距,频率=组距×
2.在频率分布直方图中各小长方形的面积之和为1.
3.利用频率分布直方图求众数、中位数与平均数
(1)最高的小长方形底边中点的横坐标即众数.
(2)中位数左边和右边的小长方形的面积和相等.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
例1(1)(多选)(2024·泰安模拟)某灯具配件厂生产了一种塑胶配件,该厂质检人员某日随机抽取了100个该配件的质量指标值(单位:分)作为一个样本,得到如图所示的频率分布直方图,则(同一组中的数据用该组区间的中点值作代表)()
A.m=0.030
B.样本质量指标值的平均数为75
C.样本质量指标值的众数小于其平均数
D.样本质量指标值的第75百分位数为85
答案ACD
解析对于A项,由题意知(0.010+0.015+m+0.035+0.010)×10=1,解得m=0.030,故A项正确;
对于B项,样本质量指标值的平均数为55×0.1+65×0.15+75×0.35+85×0.3+95×0.1=76.5,故B项错误;
对于C项,样本质量指标值的众数是70+802=7576.5,故C
对于D项,前3组的频率之和为(0.010+0.015+0.035)×10=0.60,前4组的频率之和为0.60+0.030×10=0.90,故第75百分位数位于第4组,设其为t,
则(t-80)×0.030+0.60=0.75,解得t=85,
即第75百分位数为85,故D项正确.
(2)(多选)(2024·嘉兴模拟)已知一组数据1,3,5,7,9,其中位数为a,平均数为x,极差为b,方差为s2.现从中删去某一个数,得到一组新数据,其中位数为a,平均数为x,极差为b,方差为s2,则下列说法中正确的是(
A.若删去3,则aa
B.若删去9,则xx
C.无论删去哪个数,均有b≥b
D.若x=x,则s2s
答案ACD
解析A选项,若去掉3,根据中位数的定义,
a=5,a=5+72=6,满足aa,A
B选项,若删去9,根据平均数的定义,
x=1+3+5+7+95=5
x=1+3+5+74=4
xx,B
C选项,根据极差的定义,若去掉的数是3,5,7中的一个,显然去掉前后极差都是9-1=8,满足b=b,
若去掉1,b=9-3=6b=8,若去掉9,b=7-1=6b=8,
综上,b≥b,C选项正确;
D选项,原数据平均数x=5,去掉一个数后平均数保持不变,即x=5,
则剩下的四个数之和为5×4=20,显然去掉的数只能是5,由方差的定义,
s2=15×[(1-5)2+(3-5)2+(5-5)2+(7-5)2+(9-5)2]=8
s2=14×[(1-5)2+(3-5)2+(7-5)2+(9-5)2]=10
满足s2s2,D选项正确.
[易错提醒](1)对于给出的统计图表,一定要结合问题背景理解图表意义.
(2)频率分布直方图中纵坐标不要误以为是频率.
跟踪演练1(1)(多选)海口市始终坚持生态优先,绿色低碳发展,空气质量长期领“鲜”全国.数据显示,2023年海口市空气质量创历史最高水平,位居全国168个重点城市之首.生活中常用空气质量指数(AQI)描述空气质量,AQI越小,表示空气质量越好.下表为2024年3月18日~3月24日一周内海口市和同为空气质量排行榜前十的“某市”的空气质量指数(AQI),这组数据中,以下表述正确的是()
A.海口市这一周AQI的平均数为22
B.“某市”这一周AQI的中位数为40
C.两市这一周AQI的方差或标准差可以反映出两市空气质量变化的稳定情况
D.海口市这一周AQI的方差大于“某市”这一周AQI的方差
答案AB
解析对于A,根据散点图分析可知,海口市这一周AQI的平均数为22+26+33+31+23+9+107=22,A
对于B,观察散点图知“某市”这一周的AQI按从小到大排列为31,35,36,40,42,50,74,可知中位数为40,B正确;
对于C,两市这一周AQI的方差或标准差不能完全反映出两市空气质量变化的稳定情况,C错误;
对于D,根据散点图观察海口市这一周AQI的波动小于“某市”这一周AQI的波动,所以海口市这一周AQI的方差小于“某市”这一周AQI的方差,D错误.
(2)(多选)(2024·宿州模拟)已知样本数据x1,x2,x3,x4,x5(x10,x2,x3,x4,x50)的方差为s2,平