基于图像底层特征的图像型垃圾邮件识别研究-软件工程专业论文.docx
文本预览下载声明
万方数据
万方数据
独 创 性 声 明
本人声明所呈交的学位论文是本人在导师指导下进行的研究工作 及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方 外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为 获得电子科技大学或其它教育机构的学位或证书而使用过的材料。与 我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的 说明并表示谢意。
签名: 日期: 年 月 日
关于论文使用授权的说明
本学位论文作者完全了解电子科技大学有关保留、使用学位论文 的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘, 允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文的全 部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描 等复制手段保存、汇编学位论文。
(保密的学位论文在解密后应遵守此规定) 签名: 导师签名:
日期: 年 月 日
万方数据
万方数据
摘要
摘 要
垃圾邮件已经成为世界各地电子邮件用户的公害,为了有效阻止垃圾邮件的 不断增长,国内外学者已经提出了多种垃圾邮件检测算法。当前主流的反垃圾邮 件系统主要采用了基于文本内容特征的手段来检测和过滤垃圾邮件。为了规避此 类反垃圾邮件系统的检查,垃圾邮件发送者改用“图像型垃圾邮件”来发送垃圾 信息。因此研究图像型垃圾邮件检测与过滤技术具有重要的理论意义与实际价值。
本文在详细分析了图像型垃圾邮件特点的基础上,主要完成了如下的工作: 首先, 提出并实现了一种基于圆周模板的角点信息提取算法,该算法能够快
速的提取图像中的角点信息。此算法大幅度的降低了角点检测的耗时,这为检测 垃圾邮件图像的后续处理工作赢得了时间。
其次,为提取图像的文字布局和轮廓特征,提出一种适合于垃圾邮件图像的 图像布局和轮廓特征的边缘夹角特征。实验结果表明,此特征很好的刻画了图像 的布局和轮廓特征。
最后,提出并实现了一种有效的基于图像底层特征的图像型垃圾邮件检测方 法。此方法通过提取图像布局和轮廓特征结合图像的颜色特征以及图像角点特征 实现对图像型垃圾邮件的识别。实验结果表明,此方法对垃圾邮件图像的召回率 达到 98%以上,而提取每一幅图像特征的平均时间仅需要 105ms。此方法很好的 兼顾了实时性和准确性。目前,此方法已经作为重要的功能模块集成到自主研发 的企业级垃圾信息综合举报系统中。
关键词:图像型垃圾邮件,底层特征,邮件过滤,支持向量机
I
ABSTRACT
ABSTRACT
Spam e-mail has become a public harm for e-mail users. In order to effectively prevent the continued growth of spam, many scholars have proposed spam detection algorithms. The current main anti-spam system is based on text features. In order to avoid such system check, spammers use image-based junk mail to send spam. So ,its important to study the image-based spam detection and filtering technology.
On the basis of analysis the characteristics of image-based spam, this thesis mainly complete the following work:
Firstly, this thesis proposed a corner information extraction algorithm which is based on circular template. It can quickly extract the image corner information. This algorithm greatly reduces the time-consuming of corner detection, which is very important for the following of detect spam image processing.
Secondly, to extract layout of text and profile characteristics, this thesis proposed a method to extract the feature of image layout a
显示全部