7 第七章 卡方检验-课件.ppt
文本预览下载声明
105 * 二、有序分组资料的线性趁势检验 基本思想:首先计算 R*C表资料的 值,然后将总 值分解为线性回归与偏离线性回归分量。若两分量均有统计学意义,说明两个分类变量存在相关关系,但关系不是线性关系;若线性回归分量有统计学意义,偏离线性回归分量无统计学意义时,说明两个分类变量存在相关关系,且关系为线性关系。 105 * 计算步骤:1、首先计算总 值 2、线性回归分量 3、计算偏离线性回归分量 105 * 例7-11 某研究者欲研究年龄与冠状动脉硬化等级之间的关系,将278例尸解资料整理成表7-13,问年龄与冠状动脉硬化等级是否存在线性变化趋势? 105 * 年龄 冠状动脉硬化等级 合计 - + + + + + + 20~ 70 22 4 2 98 30~ 27 24 9 3 63 40~ 16 23 13 7 59 ≥50 9 20 15 14 58 合计 122 89 41 26 278 105 * H0:年龄与冠状动脉硬化等级无线性变化趋势 H1:年龄与冠状动脉硬化等级有线性变化趋势 变异来源 自由度 P 总变异 71.4325 9 0.005 线性回归分量 63.1800 1 0.005 偏离线性回归分量 8.2525 8 0.25~.5 105 * 第七节 频数分布拟合优度的 检验 105 * 医学研究实践中,常需推断某现象频数分布是否符合某一理论分布。如正态性检验就是推断某资料是否符合正态分布的一种检验方法,但只适用于正态分布。 Pearson 值能反映实际频数和理论频数的吻合程度,故 检验可用于推断频数分布的拟合优度,且应用广泛。如正态分布,二项分布,Poisson分布,负二项分布等。 105 * 例7-12 观察某克山病区克山病患者的空间分布情况,调查者将该地区划分为279个取样单位,统计各取样单位历年累计病例数,资料见表7-15的第(1)、(2)栏,问此资料是否服从Poisson分布? 105 * 表7-15 Poisson分布的拟合与检验 *: X≥8的概率: 105 * 105 * 105 * 105 * 检验步骤 105 * 三、双向无序分类资料的关联性检验 表中两个分类变量皆为无序分类变量的行 列表资料,又称为双向无序 表资料。 105 * 注意: 双向无序分类资料为两个或多个样本,做差别检验(例7-7);若为单样本,做关联性检验。 105 * 例 7-8 测得某地5801人的ABO血型和MN血型结果如表7-11,问两种血型系统之间是否有关联? 表7-11 某地5801人的血型 (单样本,做关联性检验) 105 * 表7-10资料,可用行×列表资料 检验来推断两个分类变量之间有无关系(或关联);若有关系,可计算Pearson列联系数C进一步分析关系的密切程度: 列联系数C取值范围在0~1之间。0表示完全独立;1表示完全相关;愈接近于0,关系愈不密切;愈接近于1,关系愈密切。 105 * 检验步骤 105 * 由于列联系数C=0.1883,数值较小,故认为两种血型系统间虽然有关联性,但关系不太密切。 105 * 四、行×列表资料 检验的 注意事项 105 * 1.行列表中的各格T≥1,并且1≤T<5的格子数不宜超过1/5格子总数,否则可能产生偏性。处理方法有三种: 增大样本含量以达到增大理论频数的目的,属首选方法,只是有些研究无法增大样本含量,如同一批号试剂已用完等。 105 * 根据专业知识,删去理论频数太小的行或列,或将理论频数太小的行或列与性质相近的邻行或邻列合并。这样做会损失信息及损害样本的随机性。 注意:不同年龄组可以合并,但不同血型就不能合并。 改用双向无序R×C表的Fisher确切概率法(可用SAS软件实现)。 105 * 105 * 4、双向有序属性相同的R×C表(2×2配对设计的扩大):目的是分析两种测定结果的概率分布有无差别宜用本章介绍的卡方统计量。如研究目的是分析两种检测方法的一致性,宜用一致性检验(Kappa检验) 双向有序属性不同的R×C表 A) 若目的为分析不同年龄组患者疗效之间有无差别时,可视为单向有序R×C表资料,选用秩和检验; 105 * B) 若研究目的为分析两有序分类变量间是否存在相关关系,宜用等级相关分析,或Pearson积差相关分析; C) 若研究目的为分析两有序分类
显示全部