07第九章_卡方检验.ppt
文本预览下载声明
在双向表的χ2检验中,如果要判断两种分类特征,即两个因素之间是否有依从关系,这种χ2检验称为独立性检验。如果是判断几次重复实验的结果是否相同,这种χ2检验称为同质性检验。 二.双向表χ2检验的计算 1.理论频数的计算 双向表χ2检验中,理论频数的计算公式为 (16.1) 公式中,fxi表示横行各组实际频数的总和 fyi表示纵列各组实际频数的总和 N表示样本容量的总和 例1:家庭经济状况属于上、中、下的高三毕业生,对于是否愿意报考师范大学有三种不同的态度(愿意、不愿意、未定),其人数分布如表16-1。问学生是否愿意报考师范大学与家庭经济状况是否有关系? 表16-1 不同家庭经济状况学生报考师范大学的不同态度 家庭 经济状况 对于报考师范大学的态度 总和 愿意 不愿意 未定 上 中 下 18 20 18 27 19 7 10 20 11 55 59 36 总和 56 53 41 150 解题过程 解:1.提出假设 H0:学生是否愿意报考师范大学与家庭经济状况无关 H1:学生是否愿意报考师范大学与家庭经济状况有关 2.选择检验统计量并计算 对计数数据进行差异检验,可选择χ2检验 理论频数计算 计算理论频数允许有小数,因为χ2分布已被作为连续型的分布看待。 表16-2 不同家庭经济状况学生报考师范大学的不同态度 家庭 经济状况 对于报考师范大学的态度 总和 愿意 不愿意 未定 上 中 下 18 20 18 27 19 7 10 20 11 55=fx1 59=fx2 36=fx3 总和 56=fy1 53=fy2 41=fy3 150=N 20.53 12.72 22.03 13.44 19.43 20.85 15.03 16.13 9.84 计 算 表16-3 学生报考师范大学的态度与家庭经济状况的χ2检验计算表 愿意-上 18 20.53 -2.53 6.4009 0.3118 愿意-中 20 22.03 -2.03 4.1209 0.1871 愿意-下 18 13.44 4.56 20.7936 1.5471 不愿意-上 27 19.43 7.57 57.3049 2.9493 不愿意-中 19 20.85 -1.85 3.4225 0.1641 不愿意-下 7 12.72 -5.72 32.7184 2.5722 未定-上 10 15.03 -5.03 25.3009 1.6834 未定-中 20 16.13 3.87 14.9769 0.9285 未定-下 11 9.84 1.16 1.3456 0.1367 总 和 150 150 10.4802 3.统计决断 双向表的自由度: df=(r -1)(c -1) 查χ2值表,当 df =(3-1)(3-1)=4 时 计算结果为: χ2=10.48* 9.49 <χ2= 10.48 < 13.3,则 0.05 P 0.01 结论:学生是否愿意报考师范大学与家庭经济状况有显著关系。 双向表的χ2值除用理论频数方法计算外,还可以用下式由实际频数直接求得: 公式中,foi 表示双向表中每格的实际频数 (16.2) 将例1数据用公式(16.2)计算 =10.48 家庭 经济状况 对于报考师范大学的态度 总和 愿意 不愿意 未定 上 中 下 18 20 18 27 19 7 10 20 11 55 59 36 总和 56 53 41 150 表16-1 不同家庭经济状况学生报考师范大学的不同态度 双向表的独立性χ2检验和同质性χ2检验,只是检验的意义不同,而方法完全相同。 对于同一组数据所进行的χ2检验,有时既可以理解为独立性χ2检验,又可以理解为同质性检验,两者无根本区别。 三.四格表的χ2检验 如果r×c表的χ2检验所作的结论为差异显著,这并不意味着各组之间的差异都显著。如果需要进一步知道哪些组差异显著,哪些组差异不显著,还需进行四格表的χ2检验。 1.四格表 四格表是只有两行、两列的双向表。也就是有两个变量,每一个变量各被分为两类的双向表 变量Ⅰ 合计 变 量 Ⅱ A B A+B C D C+D 合计 A+C B+D N=A+B+C+D 2.独立样本四格表χ2检验 ⑴.缩减公式 (16.3) 独立样本四格表的计算也可以采用(16.1)式计算理论频数,并用(15.1)式计算χ2值。 ⑵.校正公式 当 df =1,样本容量总和N<30或N<50时,应对χ2 值进行连续性校正。 (16.4) 若以求理论频数的方法计算χ2值,由于df =1,那么有一组理论频数小于5时,应进行连续性校正。 例2:从甲、乙两个学校的平行班中,各随机抽取一组学生,测得他们的语文成绩如表16-4,问
显示全部