文档详情

网络新闻论文网络新闻相似度检测系统.doc

发布:2017-06-12约1.61千字共3页下载文档
文本预览下载声明
网络新闻论文:网络新闻相似度检测系统 【中文摘要】在这个信息大爆炸的时代,相似度检测已经成为一个备受重视的课题。无论是检测论文的抄袭还是对相似内容文档的检索都需要该项技术的支持。近些年来,人们对文档分词技术、模型化技术、相似度计算算法的研究深入进行,在此基础上,对相似度检测的研究有了长足的发展同时也取得了令人欣慰的成绩。不过,截止到目前为止,我们发现仍然没有出现一个在算法效率和执行结果这两个衡量算法的关键指标上都能令人完全满意的算法。本文研究的范围是网络新闻的相似度检测,这是个很有实际意义的课题。在知识经济和互联网浪潮席卷全球的今天,我们发现人类的历史上从来没有任何一种事物能像现在的英特网这样对人们的工作和生活方式产生如此巨大而深远的影响。我国同样被这种浪潮所影响,近年来网民的增长速度和绝对数量均处于世界首位,与此同时我国的网络的发展程度与发达国家有明显的差距,这种差距最直接的表现就是网速和带宽的低下。我们发现这不仅仅是硬件的差距导致的,而与大量重复的网络新闻有直接关系。据调查我国很大一部分网民在上网的过程中只是简单的浏览网络新闻,但是我们知道现在网络新闻的重复率奇高,往往同一条新闻就有上百条的不同链接。网络新闻承载的信息量巨大,所以这些重复的新闻所... 【英文摘要】In the era of information explosion, similarity detection has become a highlyimportant issue; either paper plagiarism detection or retrieval of documents with similarcontent requires the support of this technology. In recent years, with the development ofthe document segmentation techniques, modeling techniques, similarity calculationmethods, the study of similarity detection methods has had much more development andresearch results. However, so far, none of those algorithms has matched up our ordersaboutth... 【关键词】网络新闻 检测 相似度 【英文关键词】NetworkNews Detection Similarity 【目录】网络新闻相似度检测系统 摘要 4-6 Abstract 6-7 第一章 绪论 9-12 1.1 课题背景 9 1.2 课题的意义 9-10 1.3 国内和国外的研究现状 10-11 1.4 本文的组织结构及内容概要 11-12 第二章 相似度检测技术 12-20 2.1 文档模型 12-15 2.2 分词技术 15-16 2.3 相似度计算方法 16-19 2.4 本章小结 19-20 第三章 需求分析与检测方法分析 20-25 3.1 系统要解决的难点 20-21 3.2 需求分析 21-22 3.3 本文的相似度检测原理 22-24 3.4 本章小结 24-25 第四章 系统设计与实现 25-53 4.1 系统概要设计 25-32 4.2 系统详细设计 32-43 4.3 编码与实现 43-52 4.4 本章小结 52-53 第五章 总结与展望 53-55 5.1 总结 53 5.2 展望 53-55 参考文献 55-60 致谢 60
显示全部
相似文档