文档详情

logistic回归及其应用.ppt

发布:2017-06-05约4.85千字共40页下载文档
文本预览下载声明
Logistic回归分析 及其应用 温泽淮 DME中心 概述 1967年Truelt J,Connifield J和Kannel W在《Journal of Chronic Disease》上发表了冠心病危险因素的研究,较早将Logistic回归用于医学研究。 一般概念 一元直线回归 多元直线回归 一元直线回归模型 y = a + b x + e 多元直线回归模型 y = a + b1x1 + b2x2 + … + bkxk + e 一般直线回归难以解决的问题 医学数据的复杂、多样 连续型和离散型数据 医学研究中疾病的复杂性 一种疾病可能有多种致病因素或与多种危险因素有关 疾病转归的影响因素也可能多种多样 临床治疗结局的综合性 简单的解决方法 固定其他因素,研究有影响的一两个因素; 分层分析:按1~2个因素组成的层进行层内分析和综合。 统计模型 寻找合适的模型 进行logit变换 logit(p) = ln( —— ), p为y=1所对应的概率 logit(0.1) = ln( ——— ) = ln(0.1/0.9) logit(p) = ln( —— ) p=0或1时,此式失效 以 p = r/n 代之 logit(p) = ln [ (r + 0.5) / (n – r + 0.5) ] 此称经验logistic变换 以Z代上式的logit(p), Z = a + b1x1 + b2x2 + … + bkxk 称此为logistic回归模型 P = ez / (1 + ez ) ea+b1x1+b2x2+… +bkxk 1 + ea+b1x1+b2x2+… +bkxk 此为非条件logistic回归模型 应用于成组数据的分析 自变量取定一些值时,因变量取0、1的概率就是条件概率,对条件概率进行logistic回归,称为条件logistic回归 表达式: eb1x1+b2x2+… +bkxk 1 - eb1x1+b2x2+… +bkxk 常用于分析配比的资料 概述小结 logistic回归对因变量的比数的对数值( logit值)建立模型 因变量的logit值的改变与多个自变量的加权和呈线性关系 因变量呈二项分布 分析的一般步骤 变量的编码 哑变量的设置和引入 各个自变量的单因素分析 变量的筛选 交互作用的引入 建立多个模型 选择较优的模型 模型应用条件的评价 输出结果的解释 1.变量的编码 变量的编码要易于识别 注意编码的等级关系 改变分类变量的编码,其分析的意义并不改变。 牢记编码 使用变量数值标识(value labels) 记录编码内容 变量的编码 变量名 变量标识 变量值 值标识 SEX 性别 1 男 2 女 EDU 教育程度 0 文盲 1 小学 2 初中及以上 variable labels qnum 问卷序号 rnum 录入序号 pnum 病人编号 hnum 住院号/门诊号 chname 患者中文姓名 drugroup 组别 name 患者姓名 sex 患者性别 age 患者年龄 2.哑变量的设置和引入 哑变量,又称指示变量或设计矩阵。 有利于检验等级变量各个等级间的变化是否相同。 一个k分类的分类变量,可以用k-1个哑变量来表示。 哑变量的设置 SPSS提供的方法 Indicator: 默认。以第1 或最后1类作对照,其他每类与对照比较; Sample: 以第1 或
显示全部
相似文档