文档详情

多元线性回归分析.ppt

发布:2025-03-28约3.68千字共54页下载文档
文本预览下载声明

3、剩余标准差4、校正决定系数三、逐步回归分析(一)最优子集回归法求出所有自变量可能组合子集的回归方程的模型(共有2m-1个),按一定准则选择最优模型,常用的准则有:校正决定系数(考虑了自变量的个数)Cp准则(C即criterion,p为所选模型中变量的个数;Cp接近p+1的模型为最优)AIC(Akaike`sInformationCriterion)准则;AIC越小越好最优子集法的局限性01如果自变量个数为4,则所有的回归有24-1=15个;当自变量数个数为10时,所有可能的回归为210-1=1023个;……..;当自变量数个数为50时,所有可能的回归为250-1≈1015个。0201040203逐步选择法前进法(forwardselection)后退法(backwardelimination)逐步回归法(stepwiseregression)。它们的共同特点是每一步只引入或剔除一个自变量。决定其取舍则基于对偏回归平方和的F检验Y对每一个自变量作直线回归,对回归平方和最大的自变量作F检验,有意义(P小)则引入。01在此基础上,计算其它自变量的偏回归平方和,选取偏回归平方和最大者作F检验,…。局限性:后续变量的引入可能会使先进入方程的自变量变得不重要。02自变量从无到有、从少到多(1)前进法偏回归平方和最小的变量,作F检验及相应的P值,决定它是否剔除(P大)。建立新的回归方程。重复上述过程。局限性:自变量高度相关时,可能得不出正确的结果;开始时剔除的变量即使后来变得有显著性也不能再进入方程。先将全部自变量放入方程,然后逐步剔除(2)后退法逐步回归法双向筛选:引入有意义的变量(前进法),剔除无意义变量(后退法)小样本检验水准a一般定为0.10或0.15,大样本把a值定为0.05。a值越小表示选取自变量的标准越严。多元线性回归分析

Multivariatelinearregression李忠良华中科技大学同济医学院人的体重与身高、胸围血压值与年龄、性别、劳动强度、饮食习惯、吸烟状况、家族史糖尿病人的血糖与胰岛素、糖化血红蛋白、血清总胆固醇、甘油三脂射频治疗仪定向治疗脑肿瘤过程中,脑皮质的毁损半径与辐射的温度、照射的时间一个变量的变化直接与另一组变量的变化有关:如:Multivariatelinearregression概念:多元线性回归分析也称复线性回归分析(multiplelinearregressionanalysis),它研究一组自变量如何直接影响一个因变量。自变量(independentvariable)是指独立自由变量的变量,用向量X表示;因变量(dependentvariable)是指非独立的、受其它变量影响的变量,用向量Y表示;由于模型仅涉及一个因变量,所以多元线性回归分析也称单变量线性回归分析(univariatelinearregressionanalysis)多元回归分析数据格式假定因变量Y与自变量间存在如下关系:式中,是常数项,称为偏回归系数(partialregressioncoefficient)。的含义为在其它自变量保持不变的条件下,自变量改变一个单位时因变量Y的平均改变量。为随机误差,又称残差(residual),它表示的变化中不能由自变量解释的部分。一、多元线性回归方程模型x1x2y应用条件:01注意:虽然模型要求因变量是连续数值变量,但对自变量的类型不限。若自变量是分类变量,特别是无序分类变量,要转化为亚变量才能分析。对于自变量是分类变量的情形,需要用广义线性回归模型分析。021估计各项参数,建立多元线性回归方程模型2对整个模型进行假设检验,模型有意义的前提下,再分别对各偏回归系数进行假设检验。3计算相应指标,对模型的拟合效果进行评价。二、多元线性回归分析的步骤(一)模型的参数估计方程中参数的估计可用最小二乘法求得,也就是求出能使估计值和实际观察值的误差平方和为最小值的一组回归系数值。例14.127名糖尿病患者的血清总胆固醇(x1)、甘油三酯(x2)、空腹胰岛素(x3)、糖化血红蛋白(x4)、空腹血糖(y)的测量值列于表中,试建立血糖与其它几项指标关系的多元线性回归方程。各变量的离差矩阵线性回归方程模型为:对模型的假设检验—

显示全部
相似文档