医学统计学课件--第九章-双变量回归与相关(第9章).ppt
文本预览下载声明
医学统计学 事物间的相关关系 确定性关系 两变量间的函数表达式 圆的周长与半径的关系: C=2?R 路程与速度、时间的关系:L=ST 数学中X与Y的直线函数关系:Y=a+bX 非确定性关系 两变量间存在关系,但未精 确到可以用函数表达式来描述。 年龄与血脂的关系; 身高与体重的关系; 体重与体表面积的关系。 Regression 释义 CASIO fx-3600PV计算器计算a、b与r 步骤 键 盘 说 明 1 MODE 2 进入线性回归模式 LR 2 SHIFT KAC 清除以前储存数据 3 13 XDYD 3.54 DATA 数据输入 11 XDYD 3.01 DATA 9 XDYD 3.09 DATA ? ? 4 SHIFT r 显示相关系数 0.8818 5 SHIFT a 显示截距 1.6617 6 SHIFT b 显示回归系数 0.1392 SHIFT DEL 删除输错的一对数据 回归直线的有关性质 直线通过均点 各点到该回归线纵向距离平方和较到其它任何直线者为小。 因变量Y总变异 的分解 未引进回归时的总变异: (sum of squares of deviation from mean) 引进回归以后的剩余变异: (sum of squares of residuals) 回归的贡献,回归平方和: (sum of squares due to regression) X Y (体重,kg) (体表面积,103cm2 ) 11.0 5.283 11.8 5.299 12.0 5.358 12.3 5.292 13.1 5.602 13.7 6.014 14.4 5.830 14.9 6.102 15.2 6.075 16.0 6.411 相互关系示意图 相关系数的性质 相关系数的抽样分布(|? | = 0.8,n=100,1000次抽样) R.A. Fisher(1921) 的 z 变换 相关系数的z变换值的抽样分布(? = - 0.8) 相关系数的z变换值的抽样分布(? =0.8) 相关系数的可信区间估计 1. 将 r 变换为 z 。 2. 根据 z 服从正态分布,估计 z 的可信区间。 五、直线回归与直线相关的区别与联系 区别 r没有单位,b有单位; 相关表示相互关系,没有依存关系; 回归有依存关系; 对资料的要求不同: 当X和Y都是随机的,可以进行相关和回 归分析; 当Y是随机变量,X是控制变量时,理论 上只能作回归而不能作相关分析; 区别 I型回归: Y是随机变量,X是控制变量; II型回归: Y与X均是随机变量。 同一资料中由X推算Y与由Y推算X的回归方程不同: 联系 均表示线性关系 符号相同:共变方向一致 例9-14 例9-14数据散点图 病人住院天数(天) X Y 预后指数 lnY 预后指数 例9-14数据对Y作对数变换散点图 病人住院天数(天) X 用最小二乘估计只能保证 最小 不能保证将变换值方程 回代后得到的 最小。 二、曲线拟合的用途 1.定量刻画X与Y的关系。 2.用决定系数R2反应两变量曲线关系的密切程度。 Y X 0 三、常见的几种曲线 对数曲线
显示全部