模式识别论文.docx
模式识别综述与应用
院系:计算机与通信工程学院班级:电子信息
院系:计算机与通信工程学院
班级:电子信息10-01班
姓名:
学号:
模式识别综述与应用
摘要
模式识别就是研究用计算机实现人类的模式识别能力的一门学科,目的是利用计算机将对象进行分类。模式识别技术近年来得到了迅速的发展。
关键词
模式识别应用发展状况
前言
模式识别(PatternRecognition)是人类的一项基本智能,在日常生活中,人们经常在进行“模式识别”。模式识别是一个多领域的交叉学科,它涉及人工智能、统计学、计算机科学、工程学、医学等众多的研究问题。随着20世纪40年代计算机的出现以及50年代人工智能的兴起,模式识别在20世纪60年代初迅速发展并成为一门新学科。
=1\*CHINESENUM3一、模式与模式识别的概念
广义地说,存在于时间和空间中可观察的事物,如果可以区别它们是否相同或相似,都可称之为模式;狭义地说,模式是通过对具体的个别事物进行观测所得到的具有时间和空间分布的信息;把模式所属的类别或同一类中模式的总体称为模式类(或简称为类)。
模式识别是指对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程,是信息科学和人工智能的重要组成部分。
模式识别的研究主要集中在两方面,一是研究生物体(包括人)是如何感知对象的,二是在给定的任务下,如何用计算机实现模式识别的理论和方法。前者是生理学家、心理学家、生物学家、神经生理学家的研究内容,属于认知科学的范畴;后者通过数学家、信息学专家和计算机科学工作者近几十年来的努力,已经取得了系统的研究成果。
二、模式识别方法——统计模式识别方法和结构(句法)模式识别方法
把图像或图像系列分割为线条、边缘,结点,区域等并提供相应的特征,诸如灰度值、颜色、形状、纹理,深度等[5]。目的是要利用这些信息对模式进行分类或者对模式进行分析(描述)。分类是实现一个模式与
定了文法的选择,一个是所选基元的情况,另一个是要权衡文法的描述能力与文法分析的效率。
在实际应用中,往往存在某些不确定性。例如测量中的噪声和抖动会引起分割误差和基元抽取误差,从而使描述模式的语言产生二义性。在二义性存在的情况下,可以用随机语言来描述模式。产生随机语言的文法称作随机文法。在随机文法中引进了概串方法,即用具有概率分布的语句来描述模式。
(三)句法分析
句法分析则是分析输入模式是否符合某种文法规则的过程。也就是分析能否用该文法生成输入模式。分析结果为肯定则对输入模式完成了分类。分析结果为否定,则拒绝输入模式。在选择文法时需考虑文法的描述能力与句法分析复杂性之间的矛盾。同样,在研究句法分析问题时,也应考虑如何从句法分析的角度处理这种矛盾。事实上,要在提高纠错能力和降低分析效率之间进行权衡,实际困难较大。
在句法分析中,还可以采用距离或加权距离的方法。这也是一种无人管理的方法。完成集群分析以后,就可以应用文法推断技术来推断每一个群的文法,并构造出相应的句法分析器。
=3\*CHINESENUM3三、模式识别的应用
模式识别可用于文字和语音识别、遥感和医学诊断等方面。
(一)文字识别
字符识别处理的信息可分为两大类:一类是文字信息,处理的主要是用各国家、各民族的文字(如:汉字,英文等)书写或印刷的文本信息,目前在印刷体和联机手写方面技术已趋向成熟,并推出了很多应用系统;另一类是数据信息,主要是由阿拉伯数字及少量特殊符号组成的各种编号和统计数据,如:邮政编码、统计报表、财务报表、银行票据等等,处理这类信息的核心技术是手写数字识别。
汉字是历史悠久的中华民族文化的重要结晶,其数量之大,构思之精,为世界文明史所仅有。由于汉字为非字母化、非拼音化的文字,所以在信息技术及计算机技术日益普及的今天,如何将汉字方便、快速地输入到计算机中已成为关系到计算机技术能否在我国真正普及的关键问题。目前,汉字输入主要分为人工键盘输入和机器自动识别输入两种其中人工键入速度慢而且劳动强度大;自动输入又分为汉字识别输入及语音识别输入。从识别技术的难度来说,手写体识别的难度高于印刷体识别,而在手写体识别中,脱机手写体的难度又远远超过了连机手写体识别。到目前为止,除了脱机手写体数字的识别已有实际应用外,汉字等文字的脱机手写体识别还处在实验室阶段。
(二)语音识别
语音识别技术技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。近年来,在生物识别技术领域中,声纹识别技术以其独特的方便性、经济性和准确性等优势受到世人瞩目,并日益成为人们日常生活和工作中重要且普及的安验证方式。语音识别技术正逐步成为信息技术中人机接口的关键技术,语音技