9.2成对数据的统计分析(精讲)(解析版).docx
9.2成对数据的统计分析
【题型解读】
【知识必备】
1.变量的相关关系
(1)相关关系:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.
(2)相关关系的分类:正相关和负相关.
(3)线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们称这两个变量线性相关.
2.样本相关系数
(1)r=eq\f(\i\su(i=1,n,)?xi-\x\to(x)??yi-\x\to(y)?,\r(\i\su(i=1,n,)?xi-\x\to(x)?2)\r(\i\su(i=1,n,)?yi-\x\to(y)?2)).
(2)当r0时,称成对样本数据正相关;当r0时,称成对样本数据负相关.
(3)|r|≤1;当|r|越接近1时,成对样本数据的线性相关程度越强;当|r|越接近0时,成对样本数据的线性相关程度越弱.
3.一元线性回归模型
(1)我们将eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))称为Y关于x的经验回归方程,
其中eq\b\lc\{\rc\(\a\vs4\al\co1(\o(b,\s\up6(^))=\f(\i\su(i=1,n,)?xi-\x\to(x)??yi-\x\to(y)?,\i\su(i=1,n,)?xi-\x\to(x)?2),,\o(a,\s\up6(^))=\x\to(y)-\o(b,\s\up6(^))\x\to(x).))
(2)残差:观测值减去预测值,称为残差.
4.列联表与独立性检验
(1)关于分类变量X和Y的抽样数据的2×2列联表:
X
Y
合计
Y=0
Y=1
X=0
a
b
a+b
X=1
c
d
c+d
合计
a+c
b+d
n=a+b+c+d
(2)计算随机变量χ2=eq\f(n?ad-bc?2,?a+b??c+d??a+c??b+d?),利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验.
α
0.10
0.05
0.010
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
【题型精讲】
【题型一成对数据的相关性】
必备技巧判定两个变量相关性的方法
(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.
(2)样本相关系数:当r0时,正相关;当r0时,负相关;|r|越接近于1,相关性越强.
(3)经验回归方程:当eq\o(b,\s\up6(^))0时,正相关;当eq\o(b,\s\up6(^))0时,负相关
例1(2022·全国·高三专题练习)某统计部门对四组数据进行统计分析后,获得如图所示的散点图.
下面关于相关系数的比较,正确的是()
A. B. C. D.
【答案】C
【解析】由图可知:所对应的图中的散点呈现正相关,而且对应的相关性比对应的相关性要强,故,所对应的图中的散点呈现负相关,且根据散点的分布情况可知,因此,
故选:C
例2(2022·陕西·西北工业大学附属中学高三阶段练习)已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是()
A.x与y正相关,x与z负相关 B.x与y正相关,x与z正相关
C.x与y负相关,x与z负相关 D.x与y负相关,x与z正相关
【答案】C
【解析】因为y=-0.1x+1的斜率小于0,故x与y负相关.因为y与z正相关,可设z=eq\o(b,\s\up6(^))y+eq\o(a,\s\up6(^)),eq\o(b,\s\up6(^))>0,则z=eq\o(b,\s\up6(^))y+eq\o(a,\s\up6(^))=-0.1eq\o(b,\s\up6(^))x+eq\o(b,\s\up6(^))+eq\o(a,\s\up6(^)),故x与z负相关.
【跟踪精练】
1.(2022·青岛高三月考)对两个变量x,y进行线性相关检验,得线性相关系数r1=0.8995,对两个变量u,v进行线性相关检验,得线性相关系数r2=﹣0.9568,则下列判断正确的是()
A.变量x与y正相关,变量u与v负相关,变量x与y的线性相关性较强????
B.变量x与y负相关,变量u与v正相关,变量x与y的线性相关性较强????
C.变量x与y正相关,变量u与v负相关,变量u与v的线性相关性较强????
D.变量x与y负相关,变量u与v正相关,变量u与v的线性相关性较强
【答案】C
【解析】依题意:,
所以正相关,负相关,
,所以的线性相关性较强.
故选:C
2.(2022·济南高三期末)(多选)下列有关经验回归分析的说法中正确的有(