多元线性回归分析.ppt
文本预览下载声明
几个相关系数的区别 简单相关系数 复相关系数 偏相关系数 内容 概述 基本原理 数学模型 方法步骤 逐步回归方法 多元相关分析 应用 1)确定多个指标变量与一个反应变量之间的线性关系。例如,温度,湿度以及大气污染物的浓度与发病率的关系。 2)筛选疾病的危险因素和有利于健康的健康促进因素。例如,在肿瘤、冠心病等疾病的病因研究中,应用多元线性回归分析,可以从众多的相关因素中筛选出疾病的主要危险因素,并估计出这些危险因素的对引起疾病发生的相对重要程度。 3)从较易测得的自变量来推测较难测得的自变量。例如,从健康人测得的身高,体重,年龄和身体的表面积的数据回归得到的模型可以用来估计烧伤病人的身体表面积。 4)从已发生的x来预测将发生的y。例如,根据病人手术后所观察的一些指标和手术后的存活时间,建立手术后存活时间与这些指标之间的多元回归方程,可以预测其它同类型病人手术后的生存时间。 5)用于建立专家辅助诊断系统。利用著名医生诊断疾病的各项检验指标和诊断结果,建立各种疾病的发病率或死亡率和这些指标之间的关系,其他人可以借助这个模型分析病情,这就是专家辅助诊断系统。 内容 概述 基本原理 数学模型 方法步骤 逐步回归方法 多元相关分析 应用 - 实例分析 为了了解和预测人体吸入氧气的效率,收集了30名中年男性的健康状况调查资料。共调查了7个指标,它们是:吸氧的效率(y),年龄(x1),体重(x2),跑1.5公里所需的时间(x3)---以分钟计算,休息时的心跳次数(x4),跑步时的心跳率(x5),和最高心跳率(x6),数据列在表中。该问题中吸氧的效率(y)是因变量,其余6个变量是自变量。试用多元回归分析建立预测人体吸氧效率的模型。 吸氧效率调查数据 检验自变量的内相关性 【SAS程序】 data eg5_1;input y x1- x6 ;cards; 44.609 44 89.47 11.37 62 178 182 …… 47.467 52 82.78 10.50 53 170 172 run; proc reg data=eg5_1 ; model y = x1- x6/tol vif collin; run; 【SAS 部分输出结果】 Collinearity Diagnostics Eigen Condition VarProp VarProp VarProp VarProp VarProp VarProp VarProp No value Index intercp X1 X2 X3 X4 X5 X6 1 6.949 1.00000 0.0000 0.0002 0.0002 0.0002 0.0003 0.0000 0.0000 2 0.019 19.0159 0.0019 0.1750 0.0052 0.0219 0.3516 0.0000 0.0000 3 0.015 21.4484 0.0008 0.1372 0.2425 0.1318 0.0498 0.0012 0.0013 4 0.009 27.5487 0.0059 0.0302 0.1685 0.6315 0.2075 0.0014 0.0012 5 0.006 33.6343 0.0018 0.1058 0.4627 0.1145 0.3647 0.0147 0.0082 6 0.001 81.8075 0.7853 0.4776 0.0987 0.0858 0.0195 0.0703 0.0053 7 0.000 197.952 0.2043 0.0742 0.0222 0.0143 0.0066 0.9125 0.9840 用逐步过程法拟和 y 在 x 1 - x 5 上的回归模型 【SAS程序】 proc reg data=eg5_1 ; model y = x1- x5 / selection=stepwise; title Stepwise regression analysis:excluding X6; run; 【SAS 部分输出结果】 Stepwise regression analysis: excluding X6 Stepwise Procedure for Dependent Variable Y Step 1 Variable X3 Entered R-square = 0 C(p) = 10Step 2 Variable X1 Ente
显示全部