多变量统计计过程控制.ppt
文本预览下载声明
筛选性:通过抽样检查检测过程输
出,筛选出不合格产品
统计过程控制类型
预防性:通过过程控制防止不合格
产品产生的方法。
统计过程实施步骤:()构画流程图。画过程流程图,
并标注组成过程的各个阶段。其次研究过程中的数据流向
与数据储存。(2)确定问题。确定过程变量,收集变量数据
并加以分析。(3)过程探索。收集过程信息,建立经验或者
理论模型,选定统计过程控制图并决定采用哪些变量,最
后实施统计过程控制。
主元分析
主元分析可以用来实现下列目标:数据简化、数据
压缩、建模奇异值检测、变量选择、分类和预报。
t,p2+…+t,
Ⅹ=TP
其中得分向量之间是相互正交的,负荷向量之间相互正交
且长度为1,由此可得
It, sllt l
数据矩阵X的变化体现在主元所对应的负荷向量方向
上
数据矩阵X的主元计算方法
方法一:利用X的协方差矩阵计算主元
第一步:数据矩阵X的负荷向量实际上是其协方差矩阵XX的
特征向量。故需先求出协方差矩阵特征值A1≥2≥…≥n的特向
量P1,P2,Pmn。
第二步:由于X的负荷向量相互正交且长度为1.故需要对所得
上面特征向量进行正交化,单位化。
b,=p
b,=p
[b3,P2
[6. b
bm=pm b Pml, -[b2,p, b PI
[b,b[b2,b21
第三步:根据t1=XP1可求得数据矩阵的各个得分向量
即X的各个主元。
方法二:非线性迭代部分最小二乘算法( NIPALS)
利用 NIPALS算法分别计算矩阵的各个主元
NIPALS算法步骤为:
①从X中任选一列Xj,并记为t1,即t1=X
②计算p:=X/4
③将p的长度归一化:p1=PAp
④计算t:t1=X/p1
⑤将步骤②中的t1与步骤④中的t作比较,如果它们一样,则算
法已收敛,计算停止,如果它们不一样,回到步骤②,以④中的t
代替②中的t继续计算,知道算法收敛为止
上述算法只是针对第一个主元而言的,对于计算其他主元,算
法是一样的,只要将算法中的X矩阵变为相应的误差矩阵即可。
Er=X-tPi,Er=Er-t2p2.Em=Em-I-tmp
利用主元分析清除数据中测量噪声
X=1p1+t2p+…+tkpk+E
式中E为误差矩阵。因而数据X可以近似地表示为
X≈t1p1+2p2+…+bpk
通过对数据矩阵进行主元分析可以计算出矩阵的各
个主元,用前k个主元来表示数据X不仅可以起到压缩数
据维数的作用,还可以很好起到清除噪声的作用
应用主元分析压缩数据维数实例
用 Matlab指令按下列表达式产生一组四维数据:
x=randr5O 1
x,=randr5o 1
x3=2*x1-x2
1.5
从上述数学描述式可以看出,这四个变量之间是线性相关的。对
这些数据进行主几分析,得到数据的协方差短阵的特征值为:
539.46,73.32,0,0
这说明数据维数可以压缩为两维。与前两个特征值对应的特征向员为
[0.3078
0.15370.76930.5383]
[0.4754-0.6551-0.29570.5073]
因此,主元分析足对数据进行维数压缩的有效工具,它对分析和
研究过程以及对过程进行监控是非常实用的.
模型的建立
通过过程所积累的数据和实验所得到的数据,一般的
线性模型可以表达为
y=a0+arta2x2+.anx
由在生产过程中得到的一组输入输出观测值,来寻求
最佳模型参数,使得模型预测的输岀值与实际测量的输出
值之间的误差达到最小。这个寻找最佳模型参数的过程称
为线性回归。当模型具有多个输出变量时,这个过程被称
为多元线性回归。
用多元回归算法求模型最佳参数
将实测输岀值表达为模型预测值加上误差值
y=ao+ax+a,,+.a,,+Er=X6+e
所要求的最佳模型参数就是要求误差值最小,即E最
小。也可表示为EE最小。
记J=EE,求J最小值如下:
J=EE=(r-X0)(r-XB
rr-r X0-(X0)Y+8X X0
J=ry-2Y X0+0X X0
J
-2XY+2X XO
XⅩ0=XY
0=(XX)XY
用主元回归计算模型参数
X=tn+12n2+…+1+E=TP+E
用X的前k个主元来代替那些原始输入变量进行回归分
析,这样便得到下面的主元回归模型PCR
Y=bt1+b2t2+…btk=7kB
式中B=[b2·…b杓主元回归模型参数
利用最小二乘法计算得到B=(Tk)TY
由于X=7P,所以Y=7B=XPB,从上式中可以看出
O=PB=Pk(TK TK)TKY
此式即为通过主元回归得到模型参数的计算
显示全部