文档详情

数学建模判别分析.pptx

发布:2025-04-14约1.97千字共10页下载文档
文本预览下载声明

§5.1引言§5.2距离判别§5.3贝叶斯判别§5.4费希尔判别

一、两组距离判别二、多组距离判别

设组和的均值分别为和,协差阵分别为和,是一个新样品(维),现欲判断它来自哪一组。时的判别时的判别

1.时的判别判别规则:令,其中,,则上述判别规则可简化为称为两组距离判别的判别函数,由于它是的线性函数,故又可称为线性判别函数,称为判别系数。

误判概率误判概率正态组的误判概率设,则其中是两组之间的马氏距离。0102

从上述误判概率的公式中可以看出,两个正态组越是分开(即Δ越大),两个误判概率就越小,此时的判别效果也就越佳。当两个正态组很接近时,两个误判概率都将很大,这时作判别分析就没有什么实际意义。

我们可对假设进行检验,若检验接受原假设,则说明两组均值之间无显著差异,此时作判别分析一般会是徒劳的;若检验拒绝,则两组均值之间虽然存在显著差异,但这种差异对进行有效的判别分析未必足够大(即此时作判别分析未必有实际意义),故此时还应看误判概率是否超过了一个合理的水平。

误判概率的非参数估计若两组不能假定为正态组,则和可以用样本中样品的误判比例来估计,通常有如下三种非参数估计方法:令为样本中来自而误判为的个数,为样本中来自而误判为的个数,则和可估计为该方法简单、直观,且易于计算。但遗憾的是,它给出的估计值通常偏低,除非和都非常大。

No.3将整个样本一分为二,一部分作为训练样本,用于构造判别函数,另一部分用作验证样本,用于对判别函数进行评估。误判概率用验证样本的被误判比例来估计,如此得到的估计是无偏的。但是,这种方法有两个主要缺陷:需要用大样本;(ii)在构造判别函数时,只用了部分样本数据,损失了过多有价值的信息。与使用所有的样本数据构造判别函数相比,该方法将使真实的误判概率上升。该缺陷随样本容量的增大而逐渐减弱,当样本容量相当大时此缺陷基本可忽略。No.2No.1

称为交叉验证法或刀切法。该方法既避免了样本数据在构造判别函数的同时又被用来对该判别函数进行评价,造成不合理的信息重复使用,又几乎避免了构造判别函数时样本信息的损失。

2.时的判别可采用(5.2.1)式作为判别规则的形式。另一种方式是,选择判别函数为01它是的二次函数,相应的判别规则为02

§5.3贝叶斯判别AB最小平均误判代价准则最大后验概率准则

一、最大后验概率准则设有个组,且组的概率密度为,样品来自组的先验概率为,满足。则属于的后验概率为最大后验概率准则是采用如下的判别规则:

()式的一些特殊情形当时,(5.3.13)式简化为01实际应用中,如果先验概率未知,则它们通常被取成相等。02

该式等价于组数时的(5.3.2)式。实践中,若误判代价比无法确定,则通常取比值为1。当时,(5.3.13)式简化为01这时,判别新样品的归属,只需比较在处的两个概率密度值和的大小。当时,(5.3.13)式可进一步简化为02

费希尔判别(或称典型判别)的基本思想是投影(或降维):用p维向量的少数几个线性组合(称为判别式或典型变量)(一般r明显小于p)来代替原始的p个变量,以达到降维的目的,并根据这r个判别式对样品的归属作出判别。成功的降维将使判别更为方便和有效,且可对前两个或前三个判别式作图,从直观的几何图形上区别各组。

显示全部
相似文档