第六章 多元统计课件.pdf
文本预览下载声明
第六章 方差分析
在科学试验和生产实践中,影响一事物的因素往往是很多的。例如,在化工生产中,有原料
成份、原料剂量、催化剂、反应温度、压力、溶液浓度、反应时间、机器设备及操作人员的水平
等因素。每一因素的改变都有可能影响产品的数量和质量。有些因素影响较大,有些较小。为了
使生产过程得以稳定,保证优质、高产,就有必要找出对产品质量有显著影响的那些因素。为此,
我们需进行试验。方差分析就是根据试验的结果进行分析,鉴别各个有关因素对试验结果影响的
有效方法。
在试验中,我们将要考察的指标称为试验指标。影响试验指标的条件称为因素。因素可分为
两类,一类是可控因素;一类是不能控制的。因素所处的状态,称为该因素的水平。如果在一项
试验中只有一个因素在改变称为单因素试验,如果多于一个因素在改变称为多因素试验。
方差分析的基本思想是把全部数据关于总均值的总偏差平方和分解成几个部分,每一部分表
示某因素或交互作用所产生的效应,将各部分均方与误差均方相比较,从而确认或否认某些因素
或交互作用的重要性。
常用的方差分析法有以下 4 种:单因素试验方差分析、两因素试验方差分析、三因素拉丁方
设计方差分析、析因试验设计方差分析。
6.1 ANOVA 过程
一、ANOVA 过程概述
方差分析(Analysis Of Variance ,简记为ANOVA )的任务是分析数据中的变差引起的原因。
单因素方差分析是只考虑组间变差和误差变差的方差分析。在比较组间变差与误差变差时,如果
组间变差和误差变差相比较大,则各组的均值很可能是不同的,即很可能拒绝原假设,统计上就
表现为检验的 P 值小于预先给定的显著性水平。
在进行方差分析时,通常有两种数据形式:均衡数据和不均衡数据。均衡数据就是各组数据
的样本容量相等,可采用ANOVA 过程实现。而不均衡数据就是指各组数据的样本容量不相等,
要借助于 GLM 过程实现。SAS 系统在进行方差分析时,会自动识别均衡数据与不均衡数据。
在进行均衡数据的方差方析时,ANOVA 过程通常可解决如下三类统计模型:主效应模型、
交互效应模型和嵌套效应模型。
二、语句格式
语句格式为:
PROC ANOVA 选项;
CLASS 变量名;
MODEL 因变量名=效应变量名 / 选项;
MEANS 效应变量名 / 选项;
MANOVA H=效应变量名 E=效应变量名;
SAS 统计分析
三、语句说明
1、选项
(1) DATA=数据集名:指明需要方差分析的数据集。
(2) MANOVA :要求ANOVA 过程剔除含有丢失值的观测。即在分析中,剔除那些有丢失值
的因变量。
(3) OUTSTAT=数据集名。定义一个输出数据集,其中含有平方和、F 统计量及模型中每个交
谈的概率水平。
2、CLASS 语句
指明哪些变量是自变量。CLASS 语句必须出现在 MODEL 语句之前。CLASS 语句中的变量
是分类变量,可以是数值型,也可以是字符型。
3 、MODEL 语句
MODEL 语句指明因变量和自变量(因子变量)效应,其效应可以是主效应、交互效应、嵌
套效应。常用 MODEL 语句效应模型如下:
(1) 主效应模型
MODEL Y= A ;(单因素方差分析模型)
MODEL Y= A B ;(二因素方差分析模型)
MODEL Y= A B C ;(三因素方差分析模型)
模型中,A ,B ,C 是主效应,Y 是因变量。
(2) 交互效应模型
MDOEL Y= A B A*B ;
MDOEL Y= A B C A*B A*C B*C A*B*C ;
模型中,A ,B ,C 是主效应,A*B ,A*C ,B*C ,A*B*C 是交互效应,Y 是因变量。
(3) 嵌套效应模型
MODEL Y= A B C (A B) ;
在模型中, C 效应是嵌套在 A 与 B 的交互作用内的,Y 是因变量。
MODEL
显示全部