文档详情

第3篇 四格表.ppt

发布:2017-05-25约6.83千字共59页下载文档
文本预览下载声明
边缘齐性检验 按照ML估计法得到pij的估计值,代入卡方统计量即得上式。 将这一卡方检验特称为McNemar χ2检验 似然比统计量: 边缘齐性检验 经计算前例的统计量值和P-值分别为: 本章小结 什么是四格表 四格表的四种抽样方式 属性之间的独立性与不相关 单侧给定时四格表检验及其修正 总样本容量给定和完全随机情况下的检验 双侧给定时的检验-精确检验法 精确检验的大样本近似 优势比检验法 边缘齐性与对称性检验 * a1,a2和b1,b2分别是属性A和B的取值。 P35推导 * * 正是因为似然比统计量的可分解性,三维或三维以上的列联表的独立性检验问题通常使用似然比检验法。 * 由McNemar在1947年提出,, 用于分析配对资料中对照组和处理组的频数或比率是否有差异。 总的样本容量给定时四格表的检验 在总的样本容量给定情况下,随机变量服从多项分布。 在总的样本容量n给定后,四格表检验有: 条件检验法:即假定单侧给定时,应用二项分布的四格表检验方法; 依据:多项分布在给定边缘分布时服从二项分布,见教材P49 无条件检验法:应用带参数的分类数据检验方法,其检验统计量为: 总的样本容量给定时四格表的检验 将 代入卡方统计量后变形有: 可见,总的样本量给定时分类数据的卡方检验与单侧给定时的独立性检验完全相同。 总样本容量给定的似然比检验 四格表中n给定时,带参数的分类数据的似然比统计量为: 其中, 可见,与在单侧给定情况下的似然比检验统计量完全一致。 总样本容量给定四格表检验 【例】为研究导致死亡的结核病类型与性别有无关系,调查了3583个因结核病死亡的人,数据见表: 问:到底有无关系? 男性 女性 合 计 肺结核 其他结核 2356 879 180 168 3235 348 合 计 2536 1047 3583 总样本容量给定四格表检验 属于n给定时的四格表问题; 属于两个属性之间的独立性检验问题; 卡方统计量: 修正的卡方统计量(略) 似然比统计量: 完全随机时四格表的检验 在完全随机情况下,随机变量相互独立,通常假设它们服从泊松分布。 在这种情况下,四格表的检验通常采用条件检验法,即在总的样本容量n给定的假设条件下,应用其相应的四格表检验方法。 依据:当观测频数分别服从泊松分布时,给定n的条件下它们服从多项分布(教材P54)。 因此,单侧给定、总的样本容量给定和完全随机情况下的四格表检验完全相同。 似然比统计量的可分解性 在检验统计量的选取上,卡方统计量具有直观、容易理解和接受的特点;而似然比统计量可以分解,详见附录6卡方与似然比统计量的比较. 似然比统计量具有可分解性: 两侧给定时的四格表检验 前面几种方法均为近似检验方法。当样本量不是很大时,前面几种统计量的近似效果就不太好。这就需要进行费歇尔(Fisher)精确检验方法。 费歇尔精确检验实际上是单侧给定时,假设另一侧也给定的条件检验。 在两侧都给定时,考虑原假设p1=p2,备择假设p1p2,统计量n11的抽样分布为超几何分布(P56)。 n11的概率含义——具有属性B的个体中恰有n11个个体具有属性A的概率。 两侧给定时的四格表检验 于是有, 故可以认为n11比较大时拒绝原假设,即认为p1p2。对给定的显著性水平α,临界值c满足: 且c应尽可能的小。即 两侧给定时的四格表检验 当备择假设为p1p2时,可以认为n11比较小就拒绝原假设。临界值满足: 且d应尽可能大。即 当备择假设为p1≠p2时,拒绝域为: 两侧给定时的四格表检验 通常精确检验的解法是,首先计算检验的P-值,然后给出结论。 当备择假设不同时,P-值的计算有所不同; 备择假设p1p2, 备择假设p1p2, 备择假设p1≠p2(无方向检验), 当n11比较大时, 两侧给定时的四格表检验 当n11比较小时, 【例3.5】对肺癌与吸烟的问题例3.1进行费歇尔精确检验。 原题问的是肺癌患者吸烟的比例是否较高 两侧给定时的四格表检验 【解】检验的P-值为: 故拒绝原假设,认为肺癌患者中吸烟比例高。 两侧给定时的四格表检验 【例3.6】对肺癌与吸烟的问题例3.1进行无方向的费歇尔精确检验。 【解】由于备择假设为无方向检验,且n11较大,故检验 的P-值计算公式选用第一种情况,即 根据表3.1可知, n11最小为49,因此令 并得到: 两侧给定时的四格表检验 再令 得到, 因此, 。检验
显示全部
相似文档