概率論与数理统计学习指导与习题第八章.doc
文本预览下载声明
第八章 统计实验设计
一、学习要求、重点难点
通过本章的学习,应使学生理解(统计)实验、控制因素、水平、区组因素、响应变量、正交表、正交实验等基本概念,了解正交表的常见类型,掌握正交表的性质,掌握两因素实验的可加主效应模型,了解多因素实验的可加主效应模型,了解多因素实验的可加主效应模型与正交表之间的对应关系,并能用正交表安排多因素正交实验,了解正交实验的几何解释,能对正交实验结果进行直观分析与方差分析。
本章学习重点:统计实验设计的基本概念;正交表的形式与性质;两因素实验的可加主效应模型及其正交实验安排;正交实验结果的直观分析与方差分析。
本章学习难点:正交表的构造与性质;多因素实验的可加主效应模型;正交实验的几何解释;正交实验结果的方差分析。
二、内容提要
实验是对一个过程或系统的输入变量作一些有目的的改变,以使能够观察到和识别出引起输出响应变化的原因。过程或系统的一些输入变量需要在实验环境中加以控制,称为控制因素,其不同的取值或不同的取值范围称为水平。另一些变量在实验环境中不加控制,它们在实验设计或者被区组化而称为区组因素,或者被随机化而称为随机因素。过程或系统的输出变量称为响应变量或实验指标。
正交实验方法是一种应用广泛的统计实验方法,它利用正交表设计实验。
一个行列的矩阵,其第列有个不同的元素,分别以数码“1”,“2”,…,“”记之,对给定的正整数,从矩阵中任选列,比如,由这列组成一个阶的子矩阵,将这个子矩阵的每一行看作一个向量。如果恰好有个不同的向量,且每个向量在子矩阵中恰好出现次,则称此阶矩阵为水平数为,大小为,约束为,强度为的正交矩阵,记为。当时,也记为,并称为正交表。比如下图所示的正交表:
各列水平数均相同的正交表称单一水平正交表。常用的有水平数为2的正交表,,,,,。水平数为3的正交表,。水平数为4的正交表。水平数为5的正交表。
各列水平数不相同的正交表称混合水平正交表。常用的混合水平正交表有:,,,,,,。
正交表必须满足如下性质:
(1)任何一列每个不同的水平必出现相同的次数。
(2)若,则任何强度为的正交表也一定是强度为的正交表。
(3)当时,有。如果等式成立,则称该正交表为饱和正交表。比如:,,,,,,,,,。
多因素实验除研究因素的水平变化对实验指标的影响外,还需分析各因素对实验指标的作用。因此,多因素也称为析因实验。
两因素实验可表示为如下模型:
称为两因素实验的交互效应模型。模型参数共有个,其中,独立参数个数为:,正好是两因素的水平组合数或处理数。这意味着,要对这个独立参数进行估计,必须在个处理的每一个上进行至少一次试验。
如果忽略所有的交互效应,则两因素实验模型可表示如下:
称为两因素实验的可加主效应模型,模型参数共有个,其中独立参数个数为。这意味着,只要适当选择个处理进行试验,就能估计出模型中的所有参数,从而估计出个真值。
类似地,个因素的可加主效应模型为
其中, 表示第因素水平为时的主效应,且满足边界条件:
可见,多因素实验的可加主效应模型与正交表之间有一种自然的对应关系,可以利用正交表安排这样一类多因素实验,这类实验也称为正交实验。
正交实验有直观的几何解释:将维空间进行正交分解,分解成若干子空间,即为正交表各列,第列表示一个维的子空间,而第列平方和即为一维空间向量于此子空间投影的平方长度。
对正交实验的结果可以进行直观分析与方差分析。
通过直观分析,可以确定(1)各因素对实验指标影响的大小顺序;(2)实验指标随各因素水平变化的趋势;(3)可能使实验指标最佳的因素水平搭配;(4)进一步的研究方向。
通过方差分析,则可以(1)对模型的拟合程度进行检验;(2)对各因素效应进行显著性检验;(3)对效应显著的因素,对其各水平效应差异进行多重检验。
三、例题分析
例1 (Cox Snell,1981;John Quenouille,1977)
表8-1为24只六周大小的小鸡的重量(单位:克),是在12种不同的饲养方法下观测的结果。这12种饲养方法为3种因素的水平组合:3水平的蛋白质含量,2水平的蛋白质类型,2水平的添加剂水平。每种饲养方法在不同的房间里对两只小鸡进行试验。
(引自:D R Cox, N Reid. The theory of the Design of Experiments. )
(1)该实验中的控制因素、区组因素和处理分别是什么?
(2)如果对实验次数加以限制而采用正交实验,可如何安排实验?
解:
该实验中的控制因素为:蛋白质含量,蛋白质类型,添加剂水平。区组因素为饲养的房间。共有12个处理,即三个控制因素的水平组合。
可用正交表安排实验。
例2 对例1中的实验数据进行直观分析。
解:以下用R软件进行有关计算和分析。
(1)计算各因素水平下小鸡重量的
显示全部