文档详情

北医精品课程之对数线性模型精要.ppt

发布:2017-03-23约1.57千字共50页下载文档
文本预览下载声明
K维及K维以上交互作用是否有统计学意义 饱和模型的偏相关检验分析表 饱和模型的所有参数估计值及置信区间( coeff.就是? ,看置信区间是否包含0) 第1步 第2步 第3步 第4步 最终模型 最终模型的拟合优度检验 B. 估计参数及统计检验 站姿的人更容易子宫后倾 结论: 生育史与工作姿势无关,与是否子宫后倾也无关,但工作姿势(是坐姿还是立姿)与子宫是否后倾有关,不过这种关系不受生育史状态影响(即有、无生育史并不影响工作 姿势与子宫后倾的关系)。 Loglinear Analysis Model 对数线性模型 (一)对数线性模型的任务 应用于分类变量的多元统计方法,可以分析各因素之间的联系,主要用于两个以上分类变量的高维列联表分析。 (二)对数线性模型的基本原理(四格表) 四格表 1.变量特点 因变量:四格表中各格的频数。 对应的概率表(p11=n11/n……..) 2.对数线性模型(四格表) 此模型包括主效应、因素A与B的交互作用,称为饱和模型(saturated model)(包含所有主效应和交互效应,叫饱和)。 此 模型称为不饱和模型(unsaturated model)或简约模型(reduced model)。 如果模型中的交互项为0,则模型为 在对数线性模型中,通过交互效应项反映各因素是否有关及其效应大小。 对数线性模型不区分各因素为因变量和自变量,综合考虑所有因素对频数的影响。(区别logistic回归重要特征!!) 饱和模型(saturated model) 包括各级交互作用项,这种模型可以完全拟合数据,没有误差也没有自由度,所以无分析价值。 3.模型估计方法: 最大似然法(Maximum Likelihood Method):构造似然函数( Likelihood function ) 通过迭代法估计一组参数(?0, ?1 , ?2 ….. ?m),使L达到最大。 4.模型及自变量的统计检验 (1)模型检验(拟合优度检验):当P0.05,说明可以接受拟合的模型。 似然比检验(the likelihood ratio test) Pearson卡方检验 评价模型拟和的好坏:大多数单元格的标准化残差或调整残差的 绝对值小于2。 (2)自变量检验:主要关心哪些交互效应有统计学意义。 偏相关检验:比较两个嵌套模型的似然比?2的变化。 参数检验:计算参数估计值、标准误及Z检验。 OR=exp(?) lnOR=? 5.模型选择 拟合检验好 ? 参数有统计学意义 ?层次模型或谱系模型(hierarchical model) 谱系规则:当模型中包含了某几个变量的高级交互效应项时,这几个变量的低级交互效应项与主效应项也一定包含在模型之中。 随着列联表的维度增加,层次模型数量剧增,可以采用后退法筛选模型。 例1:在一项病例对照研究中,考察吸烟与肺癌是否有关。 变量说明:ca:是否为肺癌患者,0=对照;1=病例;smoke:是否吸烟,0=不吸烟,1=吸烟;freq:频数。 一般对数线性模型 先按照变量freq进行加权,再统计分析 多项分布 A.拟合饱和模型 OR:6.876(1.789,26.417)(1.928是 ? ;OR=exp(?) ) B.拟合不饱和模型 残差多大于2,拟和不好,需要加入交互项 C.?2检验 以上a、b、c三法解决同一个问题,均可 高维列联表(三维为例) 例2:370名女职工生育史、子宫后倾、工作姿势调查结果。 变量说明:a:是否有生育史,1=有生育史;2=无生育史;b:工作姿势,1=立姿,2=坐姿; c:是否子宫后倾,1=后倾,2=不后倾; freq:频数。 模型选择 先按照变量freq进行加权,再统计分析 A.模型选择
显示全部
相似文档