文档详情

第十章 卡方检验.ppt

发布:2023-09-08约2.58千字共44页下载文档
文本预览下载声明
第三十页,共四十四页,2022年,8月28日 两组构成比的比较 P157:例10-7 第三十一页,共四十四页,2022年,8月28日 第一页,共四十四页,2022年,8月28日 ?????? 本章教学目的: 推断: 两个总体率或构成比之间有无差别 多个总体率或构成比之间有无差别 两个分类变量之间有无关联性 频数分布拟合优度的检验 第二页,共四十四页,2022年,8月28日 检验的基本思想 第三页,共四十四页,2022年,8月28日 四格表资料的基本形式 第四页,共四十四页,2022年,8月28日 基本思想:可通过 检验的基本公式来理解。 式中,A为实际频数(actual frequency), T为理论频数(theoretical frequency)。 第五页,共四十四页,2022年,8月28日 检验统计量 值反映了实际频数与理论频数的吻合程度。 若检验假设H0:π1=π2成立,四个格子的实际频数A 与理论频数T 相差不应该很大,即统计量 不应该很大。 如果 值很大,即相对应的P 值很小,若 ,则反过来推断A与T相差太大,超出了抽样误差允许的范围,从而怀疑H0的正确性,继而拒绝H0,接受其对立假设H1,即π1≠π2 。 第六页,共四十四页,2022年,8月28日 由公式还可以看出: 值的大小还取决于 个数的多少(严格地说是自由度ν的大小)。由于各 皆是正值,故自由度ν愈大, 值也会愈大;所以只有考虑了自由度ν的影响, 值才能正确地反映实际频数A和理论频数T 的吻合程度。 检验的自由度取决于可以自由取值的格子数目,而不是样本含量n。四格表资料只有两行两列,=1,即在周边合计数固定的情况下,4个基本数据当中只有一个可以自由取值。 第七页,共四十四页,2022年,8月28日 样本率与总体率比较 例: 全国高血压病调查结果:城市人口高血压病患病率19.6%; 某调查获得有高血压病家族史者358人,其中高血压病者127人(P=35.47%) 问:有高血压病家族史者患病率是否高于一般人群? 第八页,共四十四页,2022年,8月28日 + - 合计 实际(A) 127 231 358 理论(T) 70.168 287.832 358 Chi-Square =57.252 第九页,共四十四页,2022年,8月28日 第一节 2× 2表 检验 第十页,共四十四页,2022年,8月28日 目的:推断两个总体率(构成比)是 否有差别 (和u检验等价) 资料:两样本的两分类个体数排列成四 格表资料 第十一页,共四十四页,2022年,8月28日 四格表资料检验的专用公式 第十二页,共四十四页,2022年,8月28日 分布是一连续型分布,而四格表资料属离散型分布,由此计算得的 统计量的抽样分布亦呈离散性质。为改善 统计量分布的连续性,则进行连续性校正。 第十三页,共四十四页,2022年,8月28日 四格表资料 检验公式选择条件: ,不校正的理论或专用公式; ,校正公式 ,直接计算概率。 连续性校正仅用于 的四格表资料,当 时,一般不作校正。 第十四页,共四十四页,2022年,8月28日 四格表资料检验的校正公式 第十五页,共四十四页,2022年,8月28日 P151:例10-1 第十六页,共四十四页,2022年,8月28日 第十七页,共四十四页,2022年,8月28日 第十八页,共四十四页,2022年,8月28日 P153:例10-2 第十九页,共四十四页,2022年,8月28日 第二十页,共四十四页,2022年,8月28日 第二十一页,共四十四页,2022年,
显示全部
相似文档