一种简单有效的手写体数字特征提取算法①-计算机系统应用.PDF
文本预览下载声明
计 算 机 系 统 应 用 2011 年 第 20 卷 第 9 期
①
一种简单有效的手写体数字特征提取算法
高宏宾,赵智彬
(五邑大学 计算机学院,江门 529020)
摘 要:综合统计特征提取法与结构特征提取法的优点,设计了一种新的基于圈、左右轮廓特征与行分段特征
来获取数字字符特征向量的方法。该办法用较少的特征向量就能够保留数字字符拓扑结构中的关键信息,适应
性很强。仿真实验中,首先根据字符容易获取的结构特征(圈)对字符进行大体分类,然后利用基于级联结构
的AD AdaBoost 神经网络根据余下的特征值进行逐层淘汰识别。结果表明,该办法在识别速度与识别正确率方
面都有所改进。
关键词:数字识别;特征提取;左右轮廓特征;行分段特征;AD AdaBoost ;级联结构
A Simple Effective Extraction Algorithm for the Features of Handwritten Digits
GAO Hong-Bin, ZHAO Zhi-Bin
(College of Computer, Wuyi University, Jiangmen 529020, China)
Abstract: A new method to capture the feature vectors of numeric alphabetic based on circles, lr- sides contour and row
subsection is proposed by intergating the opinions of Statistic Feature Extraction and Structural Feature Extraction. It
uses less feature vectors to keep the substantial information in the topologic structure of a numeric alphabetic, which has
a very strong adaptability. In the imitating experiment, first the feature vectors extracted are to be assorted roughly based
on the Structural Features (circle) of the numeric alphabetic, and then the other feature vectors is to be recognized and
eliminated gradually making use of the AD AdaBoost neural network. The result shows that, this method not only has a
faster speed of recognition, but also has a higher ratio of correct recognition.
Key words: digits recognition; feature extraction; lr- sides contour; row subsection; AD AdaBoost; cascade structure
1 引言 程度,仍需进一步探讨研究。
阿拉伯数字按联机书写与脱机书写的区别,可分
为联机手写体数字识别与脱机手写体数字识别两种方 2 相关研究
式。联机手写体数字识别是一种通过联机光电板把数 一般而言,脱机手写体数字识别包括两个基本步
字实时输入计算机的方法,它被处理的是一维点(坐标) 骤:一、是提取字符的特征;二、是根据特征进行分
串,这些点(坐标) 串中所包含的笔划走向、起终点和笔 类。其中第一步是基础。
划顺序等信息都很容易被正确提取,作为识别的关键 目前特征提取的方法多种多样,按使用特征的不
显示全部