章logistic回归分析.PPT
文本预览下载声明
第十八章 logistic回归分析 例18-1 在研究医院抢救急性心肌梗塞(AMI)患者能否成功的危险因素调查中,某医院收集了5年中该医院所有的AMI患者,共200例,研究危险因素为X1(抢救前是否休克); X2(抢救前是否心衰); X3(抢救前是否超过12小时)等。 研究目的:分析影响抢救成功的主要因素。 而我们在研究中, 又经常要分析应变量结果的产生与哪些因素有关。 例如:生存与死亡, 发病与未发病, 阴性与阳性等结果的产生可能与病人的年龄、性别、生活习惯、体质、遗传等许多因素有关。 目的:作出以多个自变量(危险因素)估计应变量(结果因素)的logistic回归方程。 资料:1. 应变量为反映某现象发生与不发生的二值变量;2. 自变量宜全部或大部分为分类变量,可有少数数值变量。分类变量要数量化。 例18-1 在研究医院抢救急性心肌梗塞(AMI)患者能否成功的危险因素调查中,某医院收集了5年中该医院所有的AMI患者,共200例,研究危险因素为X1(抢救前是否休克); X2(抢救前是否心衰); X1(抢救前是否超过12小时)等。 研究目的:分析影响抢救成功的主要因素。 用途:研究某种疾病或现象发生和多个危 险因素(或保护因子)的数量关系。 单因素 用 检验的局限性: 只能研究1个危险因素; 只能够定性。 outline Logistic回归模型的基本结构与建立 条件logistic回归 Logistic回归的应用与注意事项 一、 基本概念 Logistic回归模型的构造 若因变量y为连续型正态定量变量时, 可采用多元线性回归分析y与变量 X1, X2, … , Xp之间的关系: y=β0+β1X1+β2X2+…+βpXp 等式左边 变化范围 概率预报模型 Logistic回归模型是一种概率模型, 它是以疾病,死亡等结果发生的概率为因变量, 影响疾病发生的因素为自变量建立回归模型。 它特别适用于应变量为二项, 多项分类的资料。 在临床医学中多用于鉴别诊断, 评价治疗措施的好坏及分析与疾病预后有关的因素等。 流行病学衡量危险因素作用大小的比数比例指标。计算公式为: 三、logistic回归模型的假设检验 三、logistic回归模型的假设检验 例18-1 在研究医院抢救急性心肌梗塞(AMI)患者能否成功的危险因素调查中,某医院收集了5年中该医院所有的AMI患者,共200例,研究危险因素为X1(抢救前是否休克); X2(抢救前是否心衰); X1(抢救前是否超过12小时)等。 研究目的:分析影响抢救成功的主要因素。 方法:前进法、后退法和逐步法。检验统计量:不是 F 统计量,而是似然比统计量、 Wald 统计量和计分统计量之一。 一、logistic回归的应用 1.流行病学危险因素分析 logistic回归得到某一因素的回归系数bj后,可以很快估计这一因素在不同水平下的优势比或相对危险度,非常适用于流行病学研究(包括病例对照研究、队列研究、横断面研究)。 一、logistic回归的应用 2.校正混杂因素 流行病学中常存在一些混杂因素,logistic可以很方便的控制混杂因素的影响,得到校正后的优势比。 比Mantel-Haenszel应用方便的多。 一、logistic回归的应用 3.预测与判别 如: 通过例20-1建立的模型,根据AMI患者的危险因素暴露情况,预测AMI抢救成功的概率。 对于条件logistic回归,常数项得不到估计,不能用于预测。 有的情况下,模型的常数项没有多大实际意义。 对于病例对照研究的病例和对照的比例是人为选定的,不能代表自然人群的病例和非病例的比例,因而建立的模型常数项没有实际意义,也不能直接用于预测。 大规模的队列研究和横断面研究中,不同暴露层的发病率(或患病率等指标)与研究人群分布一致,常数项才有意义,可用来预测。 二、logistic回归应用的注意事项 1、变量的取值形式: 数值变量 —转化为有序分类,便于结果解释。 无序分类 —为了便于解释,对二项分类变量一般按0、1编码,一般以0表示阴性或较轻情况,而1表示阳性或
显示全部