文档详情

009–信息检索第九章.ppt

发布:2017-05-05约6.01千字共44页下载文档
文本预览下载声明
Open Directory() Open Directory它是一个非商业性和非盈利性的目录,拥有着庞大的自愿者编辑队伍,其中大多数都对自己负责的部分相当感兴趣,有的就是该领域的专家权威。 这个目录的编撰方式在很大程度上体现了Internet上一直存在着的“我为人人,人人为我”的奉献精神。 Open Directory也提供关键词检索,分为简单检索和高级检索。 第9章 网络信息检索工具 Galaxy() Galaxy始于1994年1月,是Internet上一个老牌的网络资源目录。它同样也采用人工编辑目录的方式,保证了收录资源的质量。它是一个建立在垂直基础上的等级式分类目录,可以提供给用户集中的相关的信息。 第9章 网络信息检索工具 9.4.1 元搜索引擎的含义和特征 元搜索引擎(Meta Search Engine)又称多元搜索引擎或集合式搜索引擎。元搜索引擎是一种将多个独立搜索引擎集成在一起,提供统一的检索界面,将用户的检索提问同时提交给多个独立的搜索引擎,并将检索结果一并返回给用户的网络检索工具。 9.4 元搜索引擎 第9章 网络信息检索工具 元搜索引擎与普通搜索引擎相比有很大的不同,元搜索引擎一般没有自己独立的数据库,更多地是提供统一链接界面(或进一步地提供统一检索方式和结果整理。 元搜索引擎具体表现为这样一些特征: 1.一次检索可以实现对多个搜索引擎的检索 2.基于独立搜索引擎结果的二次加工 3.标明结果记录的来源搜索引擎及其相关度 第9章 网络信息检索工具 元搜索引擎的功能很大程度受独立搜索引擎的限制,而且结构相对比较简单,因此不可避免的存在一定局限性。 1.检索功能简单 2.在调用搜索引擎和检索结果的数量上都存在一定的局限 3.在返回结果的精确性方面,元搜索引擎不如独立的搜索引擎 第9章 网络信息检索工具 9.4.2 元搜索引擎的原理和分类 元搜索引擎的原理 第9章 网络信息检索工具 元搜索引擎原理示意图 元搜索引擎的分类 根据检索机制的不同,可划分为目录式元搜索引擎和统一入口式元搜索引擎. 第9章 网络信息检索工具 9.4.3 元搜索引擎的技术和评价 元搜索引擎的技术 1.用户提问转换技术 2.分布式数据库调用技术 3.检索机制设计与优化技术 4.检索结果输出技术 第9章 网络信息检索工具 元搜索引擎的评价 1.元搜索引擎的初始化方式 2.覆盖的网络资源类型 3.网络信息获取方式 4.检索功能 5.检索结果输出格式 第9章 网络信息检索工具 9.4.4 主要元搜索引擎介绍 Dogpile() 1.简单检索 2.高级检索 3.其他检索 新版的Dogpile是一个非常不错的元搜索引擎,展现了元搜索引擎发展的最新成果。 第9章 网络信息检索工具 Vivisimo() Vivisimo采用了一种专门开发的启发式算法来集合或聚类原文文献。 这种算法汲取了传统人工智能思想,强调对检索结果拥有更好描述和聚类,是完全自动化的。 1.Vivisimo提供了站内检索和站外检索功能 2.Vivisimo的显示机制在网络检索工具中显得尤为突出 第9章 网络信息检索工具 Ixquick () Ixquick独创了对检索结果的排序算法,即“星星体系”,用“☆”的多少来决定检索结果的排序。 Ixquick检索结果的输出格式也十分简单实用,包括:网页名称、文摘描述、URL、源搜索引擎以及该记录在源搜索引擎中的位置信息等等。 第9章 网络信息检索工具 万纬搜索() 万纬搜索是上海万纬信息技术有限公司开发的一个中文元搜索引擎。 万纬搜索支持简单检索和高级检索 。 万纬搜索为用户提供了多种搜索结果的排列方式 。 第9章 网络信息检索工具 其他重要的元搜索引擎 1.MetaCrawler() 2.Mamma() 第9章 网络信息检索工具 * * * * * * * * * * * * * * * * 备注: 此外,元搜索引擎还有InfoGrid()、Infonetware RealTerm Search ()、Ithaki(/dir.html)、qbSearch()、Query Server()、Turbo10(/)、S()、1Blink()、Gimenei(/)、IcySpicy()、Kartoo()、SurfWax()、ByteSearch()、Fazzle()等等。 第10章 网络信息检索工具 ●网络信息检索工具的发展和类型 ●搜索引擎的发展历程 ●搜索引擎的结构及工作原
显示全部
相似文档