文档详情

ORLogistic回归-吉林大学课程中心.PPT

发布:2018-06-21约5.31千字共48页下载文档
文本预览下载声明
病例对照研究数据分析思路 推断性分析: 比较病例组和对照组之间研究因素暴露比例的差异,推断暴露和疾病之间是否存在统计学关联(χ2检验),计算关联强度(OR)及其95%的可信区间。 多因素分析:在病例对照研究中采用多因素分析往往可以比较容易地分析多个因素与疾病的联系、联系程度以及各因素之间的相互关系。目前经常使用的有条件和非条件Logistic回归模型。 病例对照研究数据分析注意事项 下结论时要慎重,不能下因果结论; 病例对照研究设计的资料通常直接采用Logistic回归模型进行分析,以控制和分析混杂作用和交互作用。通常采用条件Logistic回归分析1:1或1:M个体配比资料,非条件Logistic回归分析则用于成组设计资料。 表格数据可用Epi Info软件或EpiCalc软件分析,可计算χ2值、OR值、OR95%CI,也可进行分层分析、分级分析、趋势性χ2检验。 干预效果评价 流行病学实验性研究范畴 基线调查 分析结果 提出干预措施 实施干预 再次调查 一定时间 比较分析,评价效果 复习文献 干预效果评价 流行病学实验性研究范畴 干预效果评价 数据分析思路 研究对象完成干预情况,组间可比性 分指标比较干预前后的效果 …… 指标多少,决定的结果部分篇幅的大小 流行特征(疫情资料)分析 分析思路 总体流行强度 时间分布 地区分布 人群分布 病原体或传播媒介分布情况 人群免疫状况 …… * 病人 病历 杂志文章 医院 病例分析 * 病例分析( case series) 数据分析一般思路 病例的社会人口学特征 主要临床症状及体征分布情况 主要临床类型构成 实验室或物理仪器诊断情况 治疗与用药及疗效 预后和随访的结果 …… 可以按某种特征进行分组,进行比较分析 变化多端 Logistic回归 Logistic回归是一个较好的,目前常用的,控制混杂因素的多因素分析方法。 Logistic回归中y呈现为二值变量形式。如发病与不发病,死与活,成功与失败,阳性与阴性, 等等。当应变量只取二个数值时常记为1与0,在SAS的logistic回归中最好记成1与2。 Y=1: 反应,如: 发病,死亡,成功 Y=2:不反应,如:不发病,存活,不成功 Y:反应变量(response variable) X: 协变量(covariate),解释(explanatory)变量,伴随变量等,X可以呈现二值变量的形式,也可以计量的或等级的指标。 logistic回归是一种概率模型。设P为Y呈现反应值为1的概率,P=P(Y=1),则Q=1-P,为呈现非反应值的概率,Q=P(Y=2)。 P与各协变量Xi之间的关系可用下式表示。 Logistic回归 发病的概率:  P=[exp(b0+b1x1+…+bmxm)]/[1+exp(b0+b1x1+…+bmxm)] 不发病的概率:  Q=1-P=1/[1+exp(b0+b1x1+…+bmxm)] P/(1-P)=exp(b0+b1x1+…+bmxm) 定义y=ln[P/(1-P)]为logit变换,它是比数的自然对数值,则有    y=ln[p/(1-p)]= b0+b1x1+…+bmxm Logistic回归 Logistic回归和多元回归一样,也可用逐步剔选的方法选择变量,使方程内变量都显著,方程外变量都不显著,称为逐步Logistic回归。 Logistic回归模型既适用于队列研究,又适用于病例对照研究,也适用于现况调查。 Logistic回归 Logistic回归的应用 在队列研究中用于预测:把各协变量代入方程,得到P值,即发病的概率。 因素关联分析:分析哪些因素(协变量)对疾病的发生有显著作用。对各偏回归系数作显著性检验,如显著,则说明在排除其它因素的影响后,该因素与发病有显著关系。 求各因素在排除其它因素的影响后,对于发病的相对危险度(或比数比) 比较各因素对于发病的相对重要性:比较各标准化偏回归系数bi绝对值的大小,绝对值大的对发病的作用也大。 Logistic回归 如某因素Xi的偏回归系数为bi, 1) 则该因素Xi对于发病的比数比为exp(bi)(1) 当Xi为二值变量时,如吸烟(1=吸,0=不吸) exp(bi)为吸烟对于发病的比数比(OR) Logistic回归 2)当Xi为等级变量时,如吸烟(0=不吸,1=少量, 2=中等,3=大量)。 exp(bi)为每增加一个等级,发病的相对危险度 如大量对于不吸其发病的相对危险度为: exp(3bi) 3) 当Xi为连续变量时,如年龄(岁) exp(bi)为每增加一岁时,发病
显示全部
相似文档