对数线性模型.ppt
三、对数线性模型的假设检验1、假设检验的作用统计推论中包括参数估计与假设检验两部分,上面我们已经介绍了参数估计,那估计的可信度有多少,还要经过假设检验。不经过统计检验,研究者便不能肯定得到的参数估计是不是仅仅源于抽样误差,因而不能肯定在总体中是否存在相同情况。所有结论只能限于这个样本之内,不能肯定再抽一个样本能否得到类似结果。第25页,共43页,星期日,2025年,2月5日2、统计量似然卡方比,根据相关计算,看原假设是否成立。贝叶斯信息标准,不同模型而言越小的BIC越好。第26页,共43页,星期日,2025年,2月5日3、对数线性模型的统计检验四种主要检验:1、对于假设模型的整体检验;2、分层效应的检验;3、单项效应的检验;4、单个参数估计的检验。第27页,共43页,星期日,2025年,2月5日对数线性模型的统计检验1、对于假设模型的整体检验采用似然比卡方检验(likelihood-ratiochi-squaretest,标为L2)在样本量较大时,L2与皮尔逊卡方统计量的值十分接近。L2优越性: 1、期望频数采用似然估计方法,因而更加稳健; 2、可以被分解成若干部分,即各项效应都有对应的似然卡方值,并且它们的似然卡方值之和等于整个模型的似然卡方比值。第28页,共43页,星期日,2025年,2月5日对数线性模型的统计检验公式: 其中为估计交互频数。原假设:检验模型的频数估计与观测频数无差异,也可以理解为检验模型和饱和模型无差异。(无关假设)第29页,共43页,星期日,2025年,2月5日对数线性模型的统计检验饱和对数线性模型可以完美无缺的再现观测频数,因此不需要对饱和模型进行整体性检验。DF等于0,意味着所检验的模型与饱和模型之间的效应项目没有差别。第30页,共43页,星期日,2025年,2月5日对数线性模型的统计检验真正有意义的是检验非饱和模型(简略模型,reducedmodel)如果简略模型仍然可以比较准确的拟合观测数据(其拟合程度与饱和模型无显著差异),说明剔除的效应对于拟合意义不大。(科学的简约性原则)研究目的:不是为了再现观测频数,而是通过在模型中加入和减少交互效应项的试验,以寻求真正重要的因素。从饱和模型开始逐步剔除不重要的交互效应项,在保证拟合程度不受较大影响的前提下,直到形成效应项最少的模型。(找到最关键因素)第31页,共43页,星期日,2025年,2月5日关于对数线性模型第1页,共43页,星期日,2025年,2月5日一、对数线性模型简介1、对数线性模型基本思想
对数线性模型分析是把列联表资料的网格频数的对数表示为各变量及其交互效应的线性模型,然后运用类似方差分析的基本思想,以及逻辑变换来检验各变量及其交互效应的作用大小第2页,共43页,星期日,2025年,2月5日区别方法列联表逻辑回归对数线性模型作用分析定类变量和定类变量之间有无关系分析尺度变量(也可引入类别变量)与二分类别变量之间的因果关系综合运用方差分析和逻辑回归中的建模方法,应用于纯粹定类变量之间,系统评价各变量间关系和交互作用大小的多元统计方法优缺点不需要确定因变量和自变量。但是,卡方检验对三维和三维以上列联表资料的分析有一定困难,即对混杂变量的控制较难解决了对混杂变量的控制的问题,而且,它能将因变量与自变量的关系用模型表示出来,清晰易理解。但是,当模型中自变量较多,特别是名义变量较多,或名义变量的类别较多时,分析自变量之间的交互效应就很繁杂,可能需要建立很多哑变量可以直接分析各种类型的分类变量,对于名义变量,也不需要事先建立哑变量,可以直接分析变量的主效应和交互效应。对数线性模型不仅可以解决卡方分析中常遇到的高维列联表的“压缩”问题,又可以解决logistic回归分析中多个自变量的交互效应问题第3页,共43页,星期日,2025年,2月5日2、列联表的四种类型双向无序列联表;单向有序列联表;双向有序且属性不同的列联表;双向有序且属性相同的列联表第4页,共43页,星期日,2025年,2月5日3、列联表的优势约束条件少清晰可以快速准确进行判断第5页,共43页,星期日,2025年,2月5日4、列联表的劣势:对于多关系变量(两个以上)研究:不能被清晰解读失去了对多变量之间的交互联系的分析进行两变量间关联分析时缺乏统计控制不能准确定量描述一个变量对另一个变量的作用幅度第6页,共43页,星期日,2025年,2月5日5、对数线性模型:多维度列联表解决之道,以及模型自身特点通过数学方法(方差分析+逻辑变换)来描述多元频数分布。综合性:同