试验设计与数据处理4.pptx
文本预览下载声明
第二章 相关与回归分析; 确定性关系:现象间存在着一一对应的严格的数量依存关系。对于某一个变量的每一个数值,都有另一个变量的确定数值与之对应,又称为函数关系。
非确定性关系:现象间存在的不严格的数量依存关系。对于某一个变量的每一个数值可以有另一个变量的若干个数值与之对应,又称为相关关系,简称相关。;函数关系与相关关系的联系:
(1)由于测量误差存在,现实生活中函数关系常表现为相关关系;
(2)由于现象间数量关系规律性,相关关系常借助函数关系近似描述。
对现象间相关关系的研究,称为相关分析。
;(二)回归的概念
将具有相关关系的各个变量区分为自变量和因变量,研究自变量数值的变化对因变量数值的影响,根据自变量的数值推算因变量的数值,揭示相关关系现象间数量变动的统计规律性。
回归的分类;二、回归设计
古典的回归分析方法只是被动地处理已有的试验数据,对试验的安排不提任何要求,对如何提高回归方程的精度研究很少。
后果:盲目增加试验次数,而这些试验结果还不能提供充分的信息,以致在许多多因子试验问题中达不到试验目的。
; 对模型的合适性有时无法检验,因为在被动处理数据时在同一试验点上不一定存在重复试验数据。
为了适应寻求最佳工艺、最佳配方、建立生产过程的数学模型等的需要,人们就要求以较少的试验次数建立精度较高的回归方程。
; 为此,要求摆脱古典回归分析的被动局面,主动把试验的安排、数据的处理和回归方程的精度统一起来考虑,即根据试验目的和数据分析的要求来选择试验点,不仅使得在每一个试验点上获得的数据含有最大的信息,从而减少试验次数,而且使数据的统计分析具有一些较好的性质。
这就是二十世纪五十年代发展起来的“回归设计”所研究的问题。
; 回归设计的分类:
根据建立的回归方程的次数不同,回归设计有一次回归设计、二次回归设计、三次回归设计等;
根据设计的性质又有正交设计、旋转设计等。
本章仅介绍一次回归、二次回归的正交设计。;(一)一次回归正交设计
利用二水平正交表来安排试验的设计方法。
其主要步骤如下:
1.确定因子水平的变化范围
; 例:硝基蒽醌中某物质的含量y与以下三个因 子有关:
z1:亚硝酸钠(单位:克)
z2:大苏打(单位:克)
z3:反应时间(单位:小时)
为提高该物质的含量,需建立y关于变量z1,z2,z3的回归方程。
(因素水平表略);(1)确定因子取值范围,并对它们的水平进行编码、因子转换
本例的因子水平编码表
编码式:;(2) 数据分析;(3) 方程和系数的检验; 我们把不显著变量的偏回归平方和加到残差平方和中,从而获得方程对应的 的估计。
在本例中残差平方和变成
因此 的估计为 。;(4)零水平处的失拟检验
上述用一次回归正交设计方法求得一次回归方程是简单、易行的,但是否能真实反映实际呢?由于试验是在各因子的上水平(+1)与下水平(-1)处进行的,即使模型在这些边界点上拟合得很好,但是在因子编码空间的中心拟合是否也好呢?这可在零水平处增加若干重复试验,再通过检验来判断。
;设在各因子均取零水平时进行了m 次试验,记其试验结果为 ,其平均值为 ,其偏差平方和及其自由???为
; 对给定的显著性水平 ,
当 时认为模型在编码空间的中心也合适,不存在因子的非线性效应;否则需要另外寻找合适的模型。; 含交互作用的模型
当变量间存在交互作用时,我们可以更一般地考虑建立含两个因子间交互作用的模型,其交互作用用两个因子的编码值的乘积表示,按同样的计算便可求得诸回归系数,并对它们进行检验。;习题:
为研究贮藏温度(Z1)、氧气浓度(Z2)和二氧化碳浓度(Z3)对苹果硬度的影响,采用一次正交设计进行试验。
已知: Z12=4 Z11=8
Z22=2 Z21=10
Z32=12 Z31=3
8次实验结果为:500,467.35,462.65,462.3,
463.15,463.5,460.5,429.8
6次0水平结果为:462.5,465.85,462.75,460,463.35,458.35
;(二)二次回归正交设计; 例 为提高钻头的寿命,在数控机床上进行试验
显示全部