模式识别总结1.doc
文本预览下载声明
模式识别重点总结
目录
导论
1.1 模式,模式识别和模式的概念
1.2 模式识别的大体过程
1.3 模式识别的框架结构
1.4 模式识别系统的构成
1.5 特征提取和特征选择(结合后边章节)
贝叶斯决策(计算题)
2.1 最小错误率贝叶斯决策
2.2 最小风险贝叶斯决策
参监督学习与无监督学习
3.1监督学习与无监督学习(根据例子判断)
线性判别函数
4.1 线性判别
4.2 多类问题(简答题)
4.3 解向量与解区
4.4 线性概率
分类器的设计
5.1 正规化,训练样本,修正式
5.2 感知器法
5.3 Fisher分类准则
最近邻和K近邻(思想)
6.1 最近邻法
6.2 K-近邻法
聚类(聚类结果影响的因素)
7.1 聚类分析及其概念
7.2 相似性度量
7.3 聚类准则函数
7.4 聚类算法
导论
1.1 模式,模式识别和模式的概念
模式:通常,我们把通过对具体的个别事物进行观测所得到的具有时间 和空间分布的信息成为模式。
模式类:我们把模式所属的类别或同一类中模式的总体成为模式类(或 简称类)。
模式识别:是使机器具有这样一种能力:确定一个样本类型的属性,也就是把某一个样本归属于多个类型中的某一个类型。
1.2 模式识别的大体过程
1.3 模式识别的框架结构
A)有已知样本:监督模式识别
信息的获取:是通过传感器,将光或声音等信息转化为电信息。信息可以是二维的图象如文字,图象等;可以是一维的波形如声波,心电图,脑电图;也可以是物理量与逻辑值,如疾病诊断中病人的体温,对症状的描述和各种化验数据等。
预处理模式空间里,针对具体的研究对象,往往需要进行适当的预处理。预处理的功能包括:
清除或减少模式采集中的噪声及其它干扰,提高信噪比。
消除或减少数据图像的模糊及几何失真,提高清晰度。
转变模式的结构,以便后续处理(如非线性模式转为线性模式)。
预处理的方法:包括A\D,二值化,图象的平滑,变换,增强,恢复,滤波等, 主要指图象处理。
分类器设计:分类器设计的主要功能是通过训练确定判决规则,使按此类判决规则分类时,错误率最低。把这些判决规则建成标准库。
分类决策:在特征空间中把被识别对象进行分类,归为某一类别。
1.4 模式识别系统的构成
基于统计方法的模式识别系统是由数据获取,预处理,特征提取和选择,分类决策构成
1.5 特征提取和特征选择
特征提取 (extraction):用映射(或变换)的方法把原始特征变换为较少的新特征。
特征选择(selection) :从原始特征中挑选出一些最有代表性,分类性能最好的特征
特征提取/选择的目的,就是要压缩模式的维数,使之便于处理。
特征提取往往以在分类中使用的某种判决规则为准则,所提取的特征使在某种准则下的分类错误最小。为此,必须考虑特征之间的统计关系,选用适当的变换,才能提取最有效的特征。
特征提取的分类准则:在该准则下,选择对分类贡献较大的特征,删除贡献甚微的特征。
特征选择:从原始特征中挑选出一些最有代表性、分类性能最好的特征进行分类。
从D个特征中选取d个,共CdD种组合。- 典型的组合优化问题
特征选择的方法大体可分两大类:
Filter方法:根据独立于分类器的指标J来评价所选择的特征子集S,然后在所有可能的特征子集中搜索出使得J最大的特征子集作为最优特征子集。不考虑所使用的学习算法。
Wrapper方法:将特征选择和分类器结合在一起,即特征子集的好坏标准 是由分类器决定的,在学习过程中表现优异的的特征子集会被选中。
贝叶斯决策(计算题)
2.1 最小错误率贝叶斯决策
2.2 最小风险贝叶斯决策
**********个人感觉看书上的例子就行了*******
参监督学习与无监督学习
3.1监督学习与无监督学习(根据例子判断)
监督学习:在已知类别样本指导下的学习和训练,
参数估计和非参数估计都属于监督学习,分类
无监督学习:不知道样本类别,只知道样本的某些 信息去估计,如:聚类 分析。
线性判别函数
4.1 线性判别
判别函数包含两类:
一类 是线性判别函数:
1)线性判别函数
2)广义线性判别函数
(所谓广义线性判别函数就是把非线性判别函数映射到另外一个空间 变成线性判别函数)
3)分段线性判别函数
另一类是非线性判别函数
4.2 多类问题(简答题)
4.2.1 先了解一下俩类
4.2.1 多类问题
对于多类问题,模式有 ω1 ,ω2 , … , ωm 个类别。可分三种情况:
A)第一种情况:
每一模式类与其它所有模式类间可用单个判别平面分开。这种情况,M类可有M个判别函数,且具有以下性质:
下图所示,
显示全部