文档详情

2.5列联表的独立性检验【课件ppt】.ppt

发布:2017-10-08约2.31千字共36页下载文档
文本预览下载声明
* * 2.5 列联表的独立性检验 一、二维 列联表 列表如下: 令: 106 43 63 总计 14 11 3 不吸烟 92 32 60 吸烟 总计 不患肺癌 患肺癌 吸烟与肺癌列联表 为了调查吸烟是否对肺癌有影响,对63位肺癌患者及43位非患者(对照组)调查了其中的吸烟人数. 2×2列联表 二、二维 列联表的独立性检验 列表如下: 称为Pearson 统计量 检验统计量 例1 随机抽取某校男生35名,女生31,进行体育达标考核,结果如下表 问体育达标水平是否与性别有关? 体育达标考核情况表 66 38 28 合 计 31 18 13 女 35 20 15 男 合 计 未 达 标 达 标 体育达标水平与性别无关 体育达标水平与性别有关 (1)建立假设 其结论为:体育达标水平与性别无关. 因此在0.05显著性水平下,接受原假设. R函数chisq.test ( ) x-matrix(c(15,13,20,18),nr = 2) chisq.test(x, correct=F) R程序如下 输出结果为 Pearsons Chi-squared test data: x X-squared = 0.0057, df = 1, p-value = 0.9397 因此在0.05显著性水平下,接受原假设. 92页例2.14自己看 2.5.2 Fisher精确检验 不满足时, 用Pearson近似效果很差, 一般采用Fisher精确检验. 在使用Pearson 独立性检验时, 要注意格子 的期望频数小于5的格子数不超过总格子数的20%, 且没有一个格子的期望频数小于1 Fisher精确检验对于单元频数小的表格特别适用 四表格的Fisher精确检验 频数四表格 合计 对应的概率四表格 1 合计 假设边缘频数 固定 分别服从二项分布 表示有属性A的个体中有属性B的条件概率 表示没有属性A的个体中有属性B的条件概率 则属性A和属性B相互独立 即有属性A的个体中有属性B的个体的频率与没有属性A的个体中有属性B的个体的频率应该没有显著的差异. 即有 表示有属性A的个体中有属性B的比例高 表示有属性A的个体中有属性B的比例低 即 即 四表格的检验问题, 即属性A和B的独立性检验问题有 Fisher精确检验的统计量 假设边缘频数 都固定 事实上, 确定了, 其它三个值也就确定了 则 有下面四种取值 2 3 3 2 4 1 5 0 3 0 2 1 1 2 0 3 利用公式可以计算出 取2, 3, 4, 5的概率 在独立的原假设下, 取这些值的概率是不同的, 但各种取值都不会是小概率事件, 过大或过小都可能拒绝原假设 拒绝域形式为 Fisher精确检验的计算比较复杂, 所以一般用于n 比较小的四表格. 例:为了解某种新药的疗效是否提高, 将42位病人随机分组注射两种药物, 试验结果如下表所示 42 20 22 合计 32 18 14 旧 10 2 8 新 合计 无效 有效 药物 R程序如下 新药疗效没有提高 新药疗效有提高 x-matrix(c(8,14,2,18), nr = 2) fisher.test(x, alternative = greater) 输出结果为 Fishers Exact Test for Count Data data: x p-value = 0.04849 alternative hypothesis: true odds ratio is greater than 1 95 percent confidence interval: 1.010589 Inf sample estimates: odds ratio 4.950963 拒绝原假设,认为备则假设成立. 优势比 优势比: 属性A时,有属性B与没有属性B的优势. 称条件概率 与 之比为当个体有 为当个体没有属性A时, 有属性B与没有属性B的优势, 称这两个优势的比为优势比 下列结论成立: 如果在有属性A的个体中有B的比例高, 则优比OR1; 如果在有属性A的个体中有B的比例低,则优比OR1 如果属性A和属性B相互独立, 则优比OR=1. 优势比大于1与新药较旧药疗效有提高等价. 三、三维 列联表 关于某项政策调查所得结果 ? 观点:赞成 观点:不赞成 ? 低收入 中等收入 高收入 低收入 中等收入 高收入 男 20
显示全部
相似文档