工程图纸字符串及标注信息提取-计算机工程与应用.PDF
文本预览下载声明
Computer Engineering and Applications 计算机工程与应用 2012 ,48 (7 ) 161
⦾图形、图像、模式识别⦾
工程图纸字符串及标注信息提取
1 2
范 帆 ,关佶红
1 2
FAN Fan , GUAN Jihong
1.复旦大学 计算机学院,上海 200433
2.同济大学 计算机科学与技术系,上海 201804
1.School of Computer Science, Fudan University, Shanghai 200433, China
2.Department of Computer Science and Technology, Tongji University, Shanghai 201804, China
FAN Fan, GUAN Jihong. Recognition of characters and annotations on engineering drawings. Computer Engineering and Ap-
plications ,2012 ,48 (7 ):161-164.
Abstract :Recognition of characters and annotations on engineering drawings is very important to automated processing of engineer
drawings. It is the precondition and foundation of size and image understanding. A new algorithm is presented for recognition of charac-
ters and annotations which is based on pre-cut characters and annotations mainly focusing on the recognition, location and extraction.
By preserving the logical relations of characters and graphic annotations, what could have are coordinates of characters through compla-
nation and denoising.
Key words :pre-cut characters; annotations extraction; Optical Character Recogntion(OCR )
摘 要:工程图纸中字符串及标注信息的提取是工程图纸自动化处理极为重要的组成部分,是进行尺寸理解、图像理解等高层次
理解的前提和基础。提出一种基于工程图纸知识的预分割字符串及标注信息提取方法,重点关注工程图纸中以表格形式存在的
字符串以及图元标注信息的解析、定位、提取。通过前期处理保持字符串与字符串、图元与标注信息之间的逻辑联系,解析获得
字符串的坐标信息,对字符串所在的区域进行水平化,去除杂质线段等操作,以达到最佳的识别效果。
关键词:预分割字符串;标注信息提取;文字识别
DOI :10.3778/j.issn. 1002-8331.2012.07.042 文章编号:1002-8331(2012 )07-0161-04 文献标识码:A 中图分类号:TP391
1 引言
工程图纸的识别与理解是目前学术界和工程界研究的热
点,在机械、电子、建筑及地理信息系统等应用领域中具有重
[1]
要的实际意义 。工程图纸字符串及标注信息的提取是工程
图纸自动化处理极为重要的组成部分,其对于之后的图元建
模以及将二维图元构建成三维可视化工件具有重要的意义,
[2]
是进一步进行尺寸理解、图像理解等高层次理解的前提和基础 。
工程图纸主要由两部分组成:一是图元信息,由各种简单
几何图形交错、组合组成,从不同视角描述工件的几何形态;
二是字符串信息,用于描述工件的大小尺寸以及提供各种说
明信息。其中字符串信息可以分为两类,其一是附于图元上
的标注字符串,主要由数字、符号组成;其二是工程图纸说明
字符串,主要
显示全部