文档详情

(毕业论文)基于中文分词的搜索引擎的设计与实现.doc

发布:2016-12-13约5万字共63页下载文档
文本预览下载声明
太 原 理 工 大 学 毕业设计(论文)任务书 第1页 毕业设计(论文)题目: 基于中文分词的搜索引擎的设计与实现 毕业设计(论文)要求及原始数据(资料): 1.综述国内外搜索引擎技术研究现状; 2.深入了解搜索引擎的基本原理; 3.熟练掌握中文分词算法的原理与应用,训练基于Lucene全文检索引擎工具包 5.训练检索文献资料和资料的能力能力全文检索引擎工具包层次清晰[D]. 西安电子科技大学, 200. 土豆网视频搜索引擎系统的设计与实现[D] . 上海交通大学, 2010 刘兴建. 中文搜索引擎的应用、分析和比较[J]. 福建电脑, 2010,(11) 周君,王艳红. 一种基于词典的中文分词法的设计与实现[J]. 黑龙江科技信息, 2008,(25) 高磊,徐东平. 启发式算法在搜索引擎的应用[J]. 电脑知识与技术, 2007,1(2) 卢亮,张博文. 搜索引擎原理、实践与应用[M]. 电子工业出版社,2007,55 李颖,李志蜀,邓欢. 基于Lucene的中文分词方法设计与实现[J], 2008,45(5) 梁斌. 走进搜索引擎[M]. 电子工业出版社, 2007,191-250 彭波. 搜索引擎的混合索引技术[J]. 计算机工程与应用,2004,40(22):18 费红晓,康松林,朱小娟,等. 基于词频统计的中文分词研究[J].计算机工程与应用,2005,11(7):69 王莉云,王华,陈刚,等. 基于Lucene的全文检索系统的设计与实现[J]. 计算机工程与设计,2007,28(24):60 Lucene[EB/OL].2002./java/docs/index.html Wang Qingbo, Dai Yafei. NeShot—An Infrastructure For Scalable Wide-Area Location And Routing A. Crespo and H. Garcia-Molina. Routing Indices for Peer-to-Peer Systems. In ICDCS,July 2002 Sylvia Ratnasamy,Scott Shenker,Ion Stoica. Routing Algorithms for DHTs:Some Open Questions. In IPTPS’ 02,January 2002 Callan J.P. and M. Connell. Query-based sampling of text databases. ACM Transactions on Information Systems, 19(2):97-130,2001 张秋余,张红,马彦宏. 基于概念的中文搜索引擎技术[J]. 计算机科学,2004(21) 余海燕,张仲义. 基于单汉字索引的全文检索系统的优化研究[J].中文信息学报,2001,15(4):14-20 专业班级 软件1019班 学生 张江华 要求设计(论文)工作起止日期 2014年3月17日~2014年6月27日 指导教师签字 日期 2014年3月17日 教研室主任审查签字 日期 系主任批准签字 日期 摘 要 网络中的资源非常丰富,但是如何有效的搜索信息却是一件困难的事情。建立搜索引擎就是解决这个问题的最好方法。本文首先详细介绍了基于英特网的搜索引擎的系统结构,然后从网络机器人、索引引擎、Web服务器三个方面进行详细的说明。为了更加深刻的理解这种技术,我使用Java编程技术实现了一个自己的搜索引擎——基于中文分词的搜索引擎。 基于中文分词的搜索引擎是从指定的Web页面中按照超连接进行解析、搜索,并把搜索到的每条新闻进行索引后加入数据库。然后通过Web服务器接受客户端请求后从索引数据库中搜索出所匹配的新闻。 本人在介绍搜索引擎的章节中除了详细的阐述技术核心外还结合了基于中文分词的搜索引擎的实现代码来说明,图文并茂、易于理解。 关键词 搜索引擎;网络机器人;Web服务器;中文分词 Abstract The resources in the internet are abundant, but it is a difficult job to search some useful information. So a search engine is the best method to solve this problem. This article fist introduces the system structure of search engine based on the internet in d
显示全部
相似文档