文档详情

专题52:列联表独立性检验-2023届高考数学一轮复习精讲精练(新高考专用)(原卷版)_1.docx

发布:2025-02-21约8.01千字共18页下载文档
文本预览下载声明

专题52:列联表独立性检验

精讲温故知新

1.数值变量与分类变量

数值变量:数值变量的取值为实数,其大小和运算都有实际含义.

分类变量:这里所说的变量和值不一定是具体的数值,例如:性别变量,其取值为男和女两种,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量,分类变量的取值可以用实数表示.

注意点:

分类变量的取值可以用实数来表示,例如男性,女性可以用1,0表示,学生的班级可以用1,2,3来表示.这些数值只作编号使用,并没有大小和运算意义.分类变量是相对于数值变量来说的.

变量的不同“值”表示个体所属的不同类别,像这样的变量才是分类变量.

2:列联表:列出两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为

2×2列联表

y1

y2

总计

x1

a

b

a+b

x2

c

d

c+d

总计

a+c

b+d

a+b+c+d

构造一个随机变量K2=eq\f(n(ad-bc)2,(a+b)(a+c)(b+d)(c+d)),其中n=a+b+c+d为样本容量.

3.分类变量与列联表的实际应用

利用2×2列联表分析两个分类变量间的关系时,首先要根据题中数据获得2×2列联表,然后根据频率特征,即将eq\f(a,a+b)与eq\f(c,c+d)eq\b\lc\(\rc\)(\a\vs4\al\co1(\f(b,a+b)与\f(d,c+d)))的值相比,直观地反映出两个分类变量间是否相互影响,但方法较粗劣.

4.独立性检验的理解

1.独立性检验:利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.

2.χ2=eq\f(n?ad-bc?2,?a+b??c+d??a+c??b+d?),其中n=a+b+c+d.

注意点:

(1)卡方越小,独立性越强,相关性越弱;卡方越大,独立性越弱,相关性越强.

(2)当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;

当χ2<xα时,我们没有充分证据推断H0不成立,可以认为X和Y独立.

根据所给的观测值,与所给的临界值表中的数据进行比较,即可得出结论.

5.有关“相关的检验”

用χ2进行“相关的检验”步骤

(1)零假设:即先假设两变量间没关系.

(2)计算χ2:套用χ2的公式求得χ2值.

(3)查临界值:结合所给小概率值α查得相应的临界值xα.

(4)下结论:比较χ2与xα的大小,并作出结论.

6.有关“无关的检验”

运用独立性检验的方法

(1)列出2×2列联表,根据公式计算χ2.

(2)比较χ2与xα的大小作出结论

题型一:列联表

例1:假设有两个变量X和Y,他们的取值分别为,和,,其列联表为:

总计

21

73

8

25

33

总计

46

106

则表中,的值分别是(???????)

A.94,96 B.54,52 C.52,50 D.52,60

举一反三

下列是关于出生男婴与女婴调查的列联表

晚上

白天

总计

男婴

45

A

B

女婴

E

35

C

总计

98

D

180

那么__________.

题型二:等高条形图

例2:为了解户籍性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取了容量为100的调查样本,其中城镇户籍与农村户籍各50人,男性40人,女性60人,绘制不同群体中倾向选择生育二胎与选择不生育二胎的人数比例图(如图所示),其中阴影部分表示倾向选择生育二胎的对应比例,则关于样本下列叙述中正确的是(???????)

A.是否倾向选择生育二胎与户籍无关B.是否倾向选择生育二胎与性别有关

C.倾向选择生育二胎的人员中,男性人数与女性人数相同

D.倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数

举一反三

为了解某高校学生使用手机支付和现金支付的情况,抽取了部分学生作为样本,统计其喜欢的支付方式,并制作出如等高条形图:

根据图中的信息,下列结论中不正确的是(???????)

A.样本中多数男生喜欢手机支付B.样本中的女生数量少于男生数量

C.样本中多数女生喜欢现金支付

D.样本中喜欢现金支付的数量少于喜欢手机支付的数量

题型三:独立性检验的概念及计算

例3:(2022·湖北武汉·模拟预测)通过随机询问某中学110名中学生是否爱好跳绳,得到如下列联表:

跳绳

性别

合计

爱好

40

20

60

不爱好

20

30

50

合计

60

50

110

已知,

0.05

0.01

0.001

3.841

6.635

10.828

则以下结论正确的是(???????)

A.根据小概率值的独立性检验,爱好跳绳与性别无关

B.根据小概率值的独立性检验,爱

显示全部
相似文档