文档详情

卫生统计学第八版李晓松第十三章多重回归分析简介.ppt

发布:2018-07-14约9.28千字共52页下载文档
文本预览下载声明
* * * * * * * * * * * * 第二节 logistic回归 1. logistic回归模型的基本形式 (一) logistic回归模型 第二节 logistic回归 y=1发生的概率记为 ,y=0的概率为1- ; 为常数项, 为logistic回归系数。 2. logistic回归系数的流行病学意义 第二节 logistic回归 logistic回归模型的回归系数具有特殊含义,其解释可与流行病学中的优势比(odds ratio,OR )联系起来: 第二节 logistic回归 两个优势之比为OR: 当解释变量仅有两个取值0和1,通常定义某影响因素的暴露为1,非暴露为0,为OR: logistic回归系数可解释为:其他解释变量不变时,暴露于某影响因素 相对于非暴露于该影响因素的 值的自然对数;或者调整(控制)其他解释变量的影响后,解释变量 每增加一个单位,得到的优势比的自然对数。 (1)当时 , ,暴露与结局间不存在关联。 (2)当时 , ,暴露与结局间存在关联。 (3)当解释变量 的回归系数 时, ,提示 为危险因素。 (4)当解释变量 的回归系数 时, ,提示 为保护因素。 第二节 logistic回归 1.参数估计 (二) logistic回归模型参数估计及假设检验 第二节 logistic回归 采用极大似然估计(maximum likelihood estimate, MLE) 样本似然函数为: 对似然函数取对数后,用Newton-Raphson迭代方法获得参数的估计值及其标准误。 2. OR 值的置信区间 第二节 logistic回归 当样本含量较大时, 的抽样分布近似服从正态分布,优势比 的100( )%置信区间为: 3.假设检验 第二节 logistic回归 (1)logistic回归模型的假设检验 似然比检验统计量G为: (2)logistic回归系数的假设检验 检验统计量Wald 服从自由度为1的 分布,计算公式为: 例2 为获得两周患病居民就诊的可能影响因素,采用多阶段分层整群随机抽样进行卫生服务利用的入户调查,收集两周患病的15岁以上居民1493人,就诊者495人。调查的相关因素包括:性别、年龄、文化程度、社会医疗保障、自感疾病严重程度、最近医疗点距离、年人均收入、城乡类型和是否就诊。调查所涉及因素的变量名及赋值说明见表,收集数据的基本形式见下表。 第二节 logistic回归 因素 变量名 赋值说明 性别 x1 男=1,女=2 年龄(岁) x2 45=1,45~=2,55~=3,65~=4 文化程度 x3 小学及以下=1,初中=2,高中及中专=3, 大专=4,大学及以上=5 社会医疗保障 x4 无=0,有=1 自感疾病严重程度 x5 不严重=1,一般=2,严重=3 最近医疗点距离(公里) x6 3=0,3~=1 年人均收入(元) x7 3000=1,3000~=2,5000~=3,10000~=4 城乡类型 x8 农村=0,城市=1 是否就诊 y 否=0,是=1 两周患病居民就诊的影响因素与赋值说明 第二节 logistic回归 患者 编号 性别 年龄 文化程度 社会医 疗保障 自感疾病 严重程度 最近医疗点距离 年人均 收入 城乡 类型 是否就诊 x1 x2 x3 x4 x5 x6 x7 x8 y 1 1 2 2 1 2 0 1 1 0 2 1 4 4 1 3 0 4 1 0 3 1 4 1 1 2 0 1 0 0 4 2 4 2 1 2 0 4 1 1 5 1 4 1 1 1 1 3 0 0 … … … … … … … … … … 1489 2 4 2 1 2 0 4 1 0 1490 2 3 1 1 2 0 4 1 0 1491 2 4 2 1 2 0 3 1 0 1492 2 3 1 1 1 0 3 0 0 1493 1 1 1 1 2 0 3 0 1 两周患病居民就诊影响因素分析的部分原始数据 第二节 logistic回归 假设例2影响因素仅有社会医疗保障x4和最近医疗点距离x6,利用软件建立两周患病是否就诊的logistic回归模型为: 或 (1)有社会医疗保障,最近医疗点距离小于3公里,两周患病就诊的概率为0.34。 (2)无社会医疗保障,最近医疗点距离小于3公里,两周患病就诊的概率仅为0.16。
显示全部
相似文档