基于文字特征的规则文档碎片拼接技术研究-计算机技术专业论文.docx
文本预览下载声明
湘潭大学
学位论文原创性声明
本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的 研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或 集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均 已在文中以明确方式标明。本人完全意识到本声明的法律后果由本人承担。
作者签名: 日期: 年 月 日
学位论文版权使用授权书
本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保 留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借 阅。本人授权湘潭大学可以将本学位论文的全部或部分内容编入有关数据库进行 检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。
涉密论文按学校规定处理。
作者签名: 日期: 年 月 日
导师签名: 日期: 年 月 日
I
I
摘 要
规则文档碎片的自动拼接是数字图像处理领域中的一个重要研究课题,它通过借助 于计算机把大量的切割形状规则的文档碎片重新拼接成初始的图像。在司法、公安等部 门有专门的文档销毁工具,把纸质文档成堆的合在一起进行切割销毁。然而很多时候被 销毁的文档又重新拥有了价值,此时就需要对还保留下来的文档碎片进行拼接复原。由 人工进行拼接的话,效率非常低下,利用计算机进行自动拼接,将极大地提高工作效率。 因此,如何实现规则文档碎片的自动拼接是一项重要的研究工作。
本文将采用建立文字的笔画模型、灰度二值化、笔画特征匹配、模糊识别、统计等 方法,提出一种新的基于文字笔画特征的规则碎纸片拼接算法。通过计算机程序检测, 实验结果表明该算法效率高、鲁棒性强。
本文的主要创新如下:
1)引入文字笔画模型。通过对文字特征的分析,建立笔画模型,把像素线条抽象 成不同的笔画,并以此建立碎片的边界特征。
2)文字笔画的轮廓提取方法。探索图像边界的笔画像素的轮廓,判断笔画的类型。
3)边界的匹配算法引入匹配准则。让匹配过程遵守匹配准则,降低错误的发生。
关键词:笔画模型;规则文档碎片拼接;图像融合;边界匹配算法。
II
II
Abstract
The regular document image fragments reassembly is an important research topic in the field of digital image processing , it is by means of the computer to put a large number of
regular document image fragments together. In the judicial, public security and other departments have specialized document destruction tools, the paper documents piled together for cutting destruction. However, many of the destroyed documents again have value, and then it was necessary to restore the fragments. In the face of a large number of regular
document fragment , joining together by artificial , the efficiency is very low. Automatic
reassembly by using computer , will greatly improve work efficiency. Therefore , how to realize the technology of the regular document fragment reassembly is an important research work.
This paper will use the stroke model,image binarization,stroke feature matching,fuzzy
recognition, statistics and other methods, proposes a new algorithm based on text strokes features. Through the computer program,the experimental results show that the algorithm is of high efficiency, robustness. The main
显示全部