非线性回归分析.ppt
文本预览下载声明
Predicted(预测值) 0 1 Percent Correct (正确分类比例) Observed (观测值) 0 n00 n01 f0 1 n10 n11 f1 Overall(总计) ff Classification Table for Y 3.Cox和Snell的R 2(CoxSnell’s R-Square) 4.Nagelkerke的R 2(N agelkerke’s R-Square) 5.伪R 2(Psedo-R-square) 伪R2与线性回归模型的R2相对应,其意义相似,但它小于1。 6.Hosmer和Lemeshow的拟合优度检验统计量(Hosmer and Lemeshow's Goodness of Fit Test Statistic) 与一般拟合优度检验不同,Hosmer和Lemeshow的拟合优度检验通常把样本数据根据预测概率分为10组,然后根据观测频数和期望频数构造卡方统计量(即Hosmer和Lemeshow的拟合优度检验统计量,简称H-L拟合优度检验统计量),最后根据自由度为8的卡方分布计算其值并对Logistic模型进行检验。 如果该p值小于给定的显著性水平(如=0.05),则拒绝因变量的观测值与模型预测值不存在差异的零假设,表明模型的预测值与观测值存在显著差异。如果值大于,我们没有充分的理由拒绝零假设,表明在可接受的水平上模型的估计拟合了数据。 7.Wald统计量 Wald统计量用于判断一个变量是否应该包含在模型中,其检验步骤如下。 (1)提出假设。 (2)构造Wald统计量。 (3)作出统计判断。 ? 研究问题 在一次关于某城镇居民上下班使用交通工具的社会调查中,因变量y =1表示居民主要乘坐公共汽车上下班;y?=0表示主要骑自行车上下班;自变量x1表示被调查者的年龄;x2表示被调查者的月收入;x3表示被调查者的性别(x3=1为男性,x3=0为女性)。 试建立y与自变量间的Logistic回归,数据如表7-7所示。 7.8.2 SPSS中实现过程 表7-7 使用交通工具上下班情况 序号 x1(年龄) x2(月收入:元) x3(性别) y 1 18 850 0 0 2 21 1200 0 0 3 23 850 0 1 4 23 950 0 1 5 28 1200 0 1 6 31 850 0 0 7 36 1500 0 1 8 42 1000 0 1 9 46 950 0 1 10 48 1200 0 0 11 55 1800 0 1 12 56 2100 0 1 13 58 1800 0 1 14 18 850 1 0 15 20 1000 1 0 16 25 1200 1 0 17 27 1300 1 0 18 28 1500 1 0 19 30 950 1 1 20 32 1000 1 0 21 33 1800 1 0 22 33 1000 1 0 23 38 1200 1 0 24 41 1500 1 0 25 45 1800 1 1 26 48 1000 1 0 27 52 1500 1 1 28 56 1800 1 1 ? 实现步骤 图7-24 “Logistic Regression”对话框 图7-25 “Logistic Regression:Options”对话框 (1)第一部分输出结果有两个表格,第一个表格说明所有个案(28个)都被选入作为回归分析的个案。 7.8.3 结果和讨论 第二个表格说明初始的因变量值(0,1)已经转换为逻辑回归分析中常用的0、1数值。 (2)第二部分(Block 0)输出结果有4个表格。 (3)Omnibus Tests of Model Coefficients表格列出了模型系数的Omnibus Tests结果。 (4)Model Summary表给出了-2 对数似然值、Cox和Snell的R2以及Nagelkerke的R2检验统计结果。 (5)Hosmer and Lemeshow Test表格以及Contingency Table for Hosmer and Lemeshow Test表格给出了Hosmer和Lemeshow的拟合优度检验统计量。 (6)Classification Table分类表说明第一次迭代结果的拟合效果,从该表格可以看出对于y=0,有86.7%的准确性;对于y=1,有76.9%准确性,因此对于所有个案总共有82.1%的准确性。 (7)Variables in the Equation表格列出了Step 1中各个变量对应的系数,以及该变量对应的Wald 统计量
显示全部