第十四讲 多因素分析(二).doc
文本预览下载声明
多因素分析二
毛广运
环境不公共卫生学院
1
知识回顾
?科研步骤
?几种常见研究设计类型原理
? 横断面研究
?病例对照研究
队列研究
临床试验
3
2010/12/5
知识回顾
Logistic回归
条件Logistic回归
Logistic回归的应用及注意事项 其它
2
Procedures of a study
Study design
Major design
Statistical design
Data collection
Data management
Database design, data entry, error check, etc.
Data analysis
Statistical description
Statistical inference
Principles of case control study
问题引入
?多元回归分析可用来分析多个自发量不一
个因发量的关系,模型中因发量Y是连续性 随机发量,幵要求呈正态分布。
?医学研究经常会遇到观察指标为二值结果
的情况。如观察在一定条件下某一疾病是 否収生等。
6
1
2010/12/5
问题引入 问题引入 ?需要研究这种指标不其他观察指标的相互关系, ?为了解决这一难题,Logistic回归分析应运而生 即控制混杂因素,显示暴露因素对结果指标的作 ? 用,可否直接使用普通的线性回归分析方法呢? ?2常用估计某一指标不疾病的相关率(或构成比) 间是否具有统计学关联(单因素); 线性回归中要求应变量的取值为正态分布的随机变量,??Logistic回归主要用亍筛选疾病的危险因素或预?
而对亍观察结果仅有二值的变量的分布通常是二项分 布(第一个不合适) 后因素和评估治疗措施的效果(多因素),常用
如果勉强使用线性回归的方法迚行分析,则对应变量y 亍病例对照研究 的预测值难以解释。(第二个不合适) ?Logistic回归模型
?结果变量的取值为某一现象是否发生(0/1变量),表示在一 ? 以疾病的发生、死亡等事件的发生概率为应变量(二 定条件下某事件发生的概率,取值范围在0~1之间 分类资料,如0/1资料),以疾病发生或预后的影响因 ?多元回归的结果往往超出这一范围。 素为自变量 7 8
Logistic回归
?目的
?作出以多个自发量(危险因素)估计应发量
(结果因素)的logistic回归方程(属亍概率型非 线性回归)。
资料
应发量为反映某现象収生不丌収生的二值发量;
自发量宜全部或大部分为分类发量,可有少数数 值发量。
分类发量要数量化。
9
Logistic回归的种类
?条件Logistic回归
应变量为二分类资料
配对设计资料
?非条件Logistic回归
应变量为二分类资料
成组设计资料
?多分类Logistic回归
? 应变量为多分类的资料
10
第一节 logistic回归
(非条件logistic回归 )
11
一、基本概念
?1 发生 , 自变量X 1 2 , , X m 应变量Y ??? 0 , X ? 未发生
在m个自变量的作用下阳性结果发生的概率记作:
P ? P(Y ?1| X1 , X 2 , , X m )
0 ? P ?1
12
2
P ? 1 1 ? exp[ ?( ? ? ? X ??? X ? ??? X )] 0 2 1 1 2 m m 若令: 回 Z ? ?0 ? ?1 X1 ? ?2 X 2 ???? ?m X m 归 1 其中?0 为常数项, 模 P ? ?1 , ?2 , , ?m 为回归系数。 ? e?Z 1 型 ln ? P ? =? ? ? X ??? X ? ??? X ? log itP ? ? m 0 1 1 2 2 m ? 1? P ? 取值范围 概率P:0~1,logitP:-∞~∞。 13 2010/12/5
1 P
显示全部