文档详情

统计分析系统SAS软件第4部分.ppt

发布:2018-05-15约3.8千字共48页下载文档
文本预览下载声明
协方差分析 过程格式 PROC GLM 选项; CLASS 变量表; MODEL 依变量=效应/选项; MEANS 效应/选项; LSMEANS 效应/选项; PROC GLM 语句选项可设定分析数据集等; CLASS 指明分类变量,协方差分析时必须设定,必须在MODEL语句之前; MODEL 定义协方差分析的线性数学模型, model y=a t;一般的协方差分析模型 model y=t x(t);分离斜率模型 model y=t x x*t;共斜率模型 model后SOLUTION的选项给出参数的估计值 MEANS 语句用于计算依变量的平均数,选项用于多重比较; LSMEANS 语句计算效应的最小二乘估计的平均数(LSM) 选项E=效应,设定测验误差项,缺省为试验分析误差. STDERR给出LSM的标准误, TDIEF, PDIEF要求显示测验H0:LSM(i)=LSM(j)的t值和概率值. 应用举例 单向分组资料的协方差分析 两向分组资料的协方差分析 单因素试验的协方差分析 第六章 线性相关、回归分析与logistic回归 相关分析(CORR) 回归分析(REG) 广义线型模型(GLM) REG过程 语法格式 语法说明 MODEL语句,必需语句,定义回归分析模型 VAR语句为可选的,指定用于计算交叉积的变量 PLOT语句为可选的,用于绘制变量间的散点图,还可添加回归线。 【过程选项】 OUTEST=数据集名 指定统计量和参数估计输出的新数据集名。 NOPRINT 禁止统计结果在OUTPUT视窗中输出。 SIMPLE 输出REG过程中所用的每个变量的基本统计量。 CORR 输出MODEL语句或VAR语句中所列变量的相关矩阵。 ALL 等价于MODEL语句加上全部选项,即输出该语句所有选项分析结果。 【MODEL语句】 MODEL语句定义模型中的因变量、自变量、模型选项及结果输出选项。 语句中的变量只能是数据集中的变量,任何形式的变换都必须先产生一个新变量,然后用于分析。如X1的二次项,不能在模型中直接指定X1*X1,而要产生另一个新变量代表X1*X1,方可引入模型。 MODEL语句中常用的选项 NOINT 在模型中不拟合常数项。 STB 输出标准化回归系数。 CLI 输出个体预测值的95%可信区间上下限。 CLM 输出因变量期望值(均值)的95%可信区间上下限。 R 输出个体预测值、残差及其标准误。 P 输出实际值Yi、预测值 和残差等。如已选择了CLI、CLM和R,则无需选择P。 【关键字】 结果解释 如果在MODEL语句中使用CLI、CLM选项,则系统输出因变量均值以及个体预测值的95%可信区间上下限,输出如下 CORR过程 PROC CORR [选项] ;  [VAR 变量名列 ;[1]  WITH 变量名列;[2]  WEIGHT 变量名;  FREQ 变量名;  BY 变量名列;] 语法说明 除了PROC语句为必需,其他语句都是可选的,如果省略所有的可选语句,则对所有变量作相关分析。 VAR语句,可选的语句,定义相关分析的变量 WITH语句,可选的语句,定义分析相关性的另一组变量 PROC CORR;  VAR A B; WITH X Y Z ; 结果解释 例 下表给出了12名不同年龄(岁,X)妇女的收缩压测量值(mmHg,Y),试进行回归分析。 (1) 制作散点图; (2) 建立由X预报的回归方程,制作回归直线; (3) 对回归方程及回归系数b进行假设检验; (4) 绘制的95%可信区间; (5) 建立单个Y值的预报方程; (6) 计算积矩相关系数,并进行假设检验。 多元线性回归 REG过程: 只要把要分析的多个自变量名放在MODEL语句中应变量后即可。 语法选项 (MODEL语句选项) SELECTION=method,规定变量筛选的方法,method可以是以下几种选项 FORWARD(或F),前进法,按照SLE规定的P值从无到有依次选一个变量进入模型 BACKWARD(或B),后退法,按照SLS规定的P值从含有全部变量的模型开始,依次剔除一个变量 STEPWISE(或S),逐步法,按照SLE的标准依次选入变量,同时对模型中现有的变量按SLS的标准剔除不显著的变量 MODEL语句选项 NONE,即不选择任何选项,不作任何变量筛选,此时使用的是含有全部自变量的全回归模型 MODEL语句选项 SLE=概率值,入选标准,规定变量入选模型的显著性水平,前进法的默认是0.5,逐步法是0.15 SLS=概率值,剔除标准,指定变量保留在模型的显著水平,后退法默认为0.10,逐步法
显示全部
相似文档