基于R软件的logistic回归模型建模.pdf
文本预览下载声明
20lO年第11期 黑龙江对外经贸 No.11。2010
总第197期 H【J Relations&Trade SerialNo.197
Forei印Economic
[经济管理]
stic
基于R软件的logi
回归模型建模
王怀亮
(菏泽学院,山东菏泽274015)
[摘要]Ⅻstic回归模型是研究因变量为二分类观察结果与影响因素(自变量)之间关系的重要多变
量分析方法模型,但它的计算依赖于统计软件。通过具体实例对自由优秀R软件在处理分析bgistic回归模
型作出简要分析。
[关键词]R软件;lo痴石c回归;广义线性模型
[中图分类号】0212.1 【文献标识码]B 【文章编号】1002—2880(2010)11一0117—02
线性回归模型是定量分析中最常用的统计分析方 求解相应的参数值,所得到的估计值称为参数的最大似
法,但线性回归分析一般要求响应变量是连续变量、数据 然估计值。最大似然估计具有的一致性、有效性和正态
分布为正态分布等条件。在实际分析研究中,经常遇到 性都是一些很好的统计性质,样本数据越大时其估计值
的是非连续的响应变量,即分类响应变量,如经济学研究 就越准确。
中所涉及的是否购买某种商品、是否满意某种服务等,政 由于bgistic回归模型就是基于二项分布族的广义
治学中经常涉及的研究是否选举某候选人、流行病学中 线性模型,因此在R软件中,Logistic回归分析可以通过
研究的是否患病等。在研究二分变量与诸多自变量的相 调用广义线性回归模型函数glIlI()来实现,其调用格式
互关系时,常选用b舀stic回归模型。 为
由于I僻i8tic回归模型涉及较复杂的数学理论,一般
无法用手工计算,必须有计算机和统计软件的支持,在统
明分布为二项分布,data为可选择的数据框。
计软件方面,常用的统计软件有SPSs、SAs、sTAT、R、
s—PLus等。R软件是一个自由、免费、开源的软件,是一 二、实例分析
个具有强大统计分析功能和优秀统计制图功能的统计软 例lcoup0璐.sta是一组研究赠券效果的数据。研究
件,现已是国内外众多统计学者喜爱的数据分析工具。 者随机选择1000户家庭,将面值分别为5美分、10美分、
15美分、20美分或30美分的折扣券发给他们,每种面值
本文结合实例介绍了R软件在kgistic回归模型中的应
的折扣都是200张,发给200个家庭。研究者感兴趣的
用。
是折扣券的面值是否影响人们对它们的使用,因此因变
一、基于R的bgisdc回归模型
量可以表示为每种折扣券分别有多少张被使用,以此来
k百stic回归(10画sticreg陀ssi∞)是研究因变量为二
考察折扣券的效果。得到的数据如下表所示,每一行表
分类观察结果与影响因素(自变量)之间关系的一种多
示在某一折扣水平下,使用或不使用折扣券的户数,最后
变量分析方法,属概率型非线性回归。一般L0画stic模型
一列表示折扣券的实际效果,即是否被使用,“是”编码
为:
显示全部