(第3章方差分析.doc
文本预览下载声明
第3章 方差分析
两类变量: 定量变量 连续取值, 计数取值;
定性变量 性质标记, 称为因素
方差分析: 因素取不同状态时, 对因变量的影响.
§3.1 单因素方差分析
因素的水平: 因素的不同状态;
因素的个水平: , 等等.
例如某农作物产量, 作物品种, 化肥品种,
;
主要思想为显著性检验, 即
的总变化量=各因素各水平及交互影响+随误影响
1. 单因素方差分析模型
设所关心变量为,影响的因素为,有个水平,
假设如下表: (各样本独立, 同方差)
因素A的水平 总 体 样本
令 ,
则有(相当于个回归模型)
(3.1),
称 为总容量;
为总平均;
为水平的效应(影响度)
且满足, 最后归结为
(3.2)
2. 因素效应的显著性检验
对于单因素,
目标之一: 该因素各水平对取值有无显著差异.
即检验如下假设
不全相等(3.3)
等价地, 对模型(3.2), 检验假设
至少有某个(3.4)
分解影响且设计统计量
令
, 则
, 则,
,
, 则
数据的总变化量
总平方和:
分解为
(展开交叉项=0)
,
基本分析
1) ,
2) 随差异小而小
的统计性质
令, 则, 从而
,
无论成立否, 是的一个无偏估计.
另一面, 因
所以,
从而可知
当为真, 是无偏估计.
否则, 有偏大趋势, 构造统计量
当为真, 则应在1波动, 否则趋大.
因为
()
又由各总体样本的相互独立性、的可加性, 得
另有(参见[4]) 且与独立,
故当真,
检验的值为
对给出的,
若, 则拒绝, 各水平的效应有显著差异;
否则, 不能拒绝,认为各水平的效应无显著差异.
SAS中的proc anova用于单因素的方差分析.
例3.1 幼鼠对三种食谱的体重增加量的数据如下, 试分析营养效果是否明显差异.
解 调用proc anova(example3_1), 程序为:
data examp3_1;
input recipe $ weight @@;
cards;
a1 164 a1 190 a1 203 a1 205
a1 206 a1 214 a1 228 a1 257
a2 185 a2 197 a2 201 a2 231
a3 187 a3 212 a3 215 a3 220
a3 248 a3 265 a3 281
;
run;
proc anova data=examp3_1;
class recipe;
model weight=recipe;
run;
得
较大, 不能拒绝, 认为无明显差异.
例3.2 分析四个实验室试制的纸张光滑度有无差异.
()
解: 调用proc anova(example3_2),
data examp3_2;
input lab $ smooth @@;
cards;
a1 38.7 a1 41.5 a1 43.8 a1 44.5
a1 45.5 a1 46.0 a1 47.7 a1 58.0
a2 39.2 a2 39.3 a2 39.7 a2 41.4
a2 41.8 a2 42.9 a2 43.3 a2 45.8
a3 34.0 a3 35.0 a3 39.0 a3 40.0
a3 43.0 a3 43.0 a3 44.0 a3 45.0
a4 34.0 a4 34.8 a4 34.8 a4 35.4
a4 37.2 a4 37.8 a4 41.2 a4 42.8
;
run;
proc anova data=examp3_2;
class lab;
model smooth=lab;
run;
得
较小, 四个实验室并不全相同, 其中必有一个有明显差异.
3. 因素各水平均值的估计与比较
当知各水平不全相同是, 要做
(1) 各水平均值的估计及其置信区间
是的一个无偏估计, 及
由它与(即与)独立性及
, 可得
对给定的置信水平,由
得置信区间为
(2) 各对均值差异的置信区间
因素水平和上的的点估计与区间估计
由与独立等性质, 得
从而有
与独立, 得
即
由此可得置信区间:
若含0, 则认为与无明显差异;
若在0左侧, 则认为;
若在0右侧, 则认为.
例3.3 续上例求各实验室的均值及之差的置信区间,
.
data examp3_3;
input lab $ smooth @@;
cards;
a1 38.7 a1 41.5 a1 43.8 a1 44.5
a1 45.5 a1 46.0 a1 47.7 a1 58.0
a2 39.2 a2 39.3 a2 39.7 a2 41.4
a2 41.8 a2 42.9 a2 43.
显示全部