第八讲 网络信息检索.ppt
文本预览下载声明
第八讲 网络文献检索技巧 目的 了解网络资源检索的类型 熟悉网络检索工具——搜索引擎 了解如何利用不同的检索工具类型查找学术资源 综合利用检索工具与检索知识 网络环境下信息获取的方式 查看、浏览 网络资源指南 查询 关键词:单词、词组、布尔、自然语言 模式匹配:前方一致、后方一致、模式表达式 间接获取 网络信息检索技术 分类检索 关键词检索 布尔逻辑检索 词组检索 网络信息检索工具 网络信息检索工具的类型 按检索机制划分: 搜索型 目录型:open directory project,搜狗 混合型 按采集内容划分: 综合型 专科型:medicalworldsearch, engineering electronic library 专题型:switchboard、电话号码 按包含检索工具数量划分 单独的 集合的:元搜索引擎 搜索引擎 什么是搜索引擎? 搜索引擎是从英文“search engine”意译、音义。 它是一种利用网络自动搜索技术、对因特网各种资源进行标引、并提供检索者检索的工具。 如: , , :8080/ 发展: 1994年,基于WWW的搜索引擎Lycos诞生, 1995年,商业性搜索引擎开始开发,第一代产品:Yahoo, Excite, Infoseek, AltaVista, 从典型的目录式分类结构(Yahoo)到全文搜索引擎(AltaVista) 搜索引擎的类型 单一搜索引擎(拥有自己的数据库) www. A www.G www.B Infoseek /srsapp/ 什么是元搜索引擎? 又称为集合式搜索引擎 它是将多个搜索引擎集成在一起,并提供一个统一的检索界面 可分为两种类型:搜索引擎目录和多元搜索引擎。 该检索工具可以同时检索多个搜索引擎的数据库,并把结果列在一份清单上。 元搜索引擎(利用多个搜索引擎的数据库) All-in-one Metacrawler WebCrawler 万纬搜索 mamma 网络资源目录 目录型检索工具,又称为分类站点目录、专题目录或主题指南、站点导航系统等。 特点: 开发者收集资源 按一定的分类法进行组织整理 有的也与检索法集成在一起 例:分类搜索引擎,学科资源导航等 , , 目前许多网络上流行的检索工具既不是单纯的搜索引擎,也不是单纯的主题目录,而是这两者的结合。 如infoseek,lycos,它们不仅可以按关键词查询,还可以按目录查询,因此,搜索引擎的涵义也变得更加宽泛,很多情况下它指代这样的工具。 搜索引擎的评价标准 a. 数据库规模 b. 索引方式 c. 检索功能 d. 检索结果 e. 界面设计 f. 响应时间 g. 查准率 检索技巧 选择合适的搜索引擎,交叉学科用搜索引擎好一些 缩小检索范围:双引号的使用 扩大检索范围:相关词的使用 检索技术的应用 部分搜索引擎介绍 Fast/AllTheWeb / AllTheWeb是当今成长最快的搜索引擎,目前支持225种文件格式搜索,其数据库已存有49种语言的31亿个Web文件。而且以其更新速度快,搜索精度高而受到广泛关注,被认为是Google强有力的竞争对手。 Fast总部位于挪威,成立于1997年,其技术起源于挪威科技大学(Norwegian University of Science and Technology)的相关研究开发结果。公司全称为Fast Search Transfer (FAST) ASA。 AllTheWeb属于全文搜索引擎。目前提供常规搜索、高级搜索和主题搜索功能。 常规搜索支持普通关键词搜索,以及+、-、括号()等逻辑命令符号,分别对应AND、NOT、OR等布尔逻辑命令,并且可使用引号进行精确匹配搜索 AltaVistahttp://www.AltaV/ 是功能全面的搜索引擎,曾经名噪一时,但现在其地位已被Google取代。即便如此,它仍被认为是功能最完善,搜索精度较高的全文搜索引擎之一。截止2002年6月,AltaVista宣称其数据库已存有11亿个Web文件,并且经过升级,其搜索精度已达业界领先水平。 AltaVista提供常规搜索、高级搜索和主题搜索,主题包括图象(Images)、MP3/Audio Video等。主页显示LookSmart 的索引目录并提供LookSmart注册。高级搜索提供用户以日期、语种、布尔逻辑和近似条件搜索。常规及高级搜索均允许针对Title、URL或特定的域名进行检索。用户还可以在定制的搜索条件(包括Title、 URL、Host、Links(如anchor、applet、image和text)等)输入框中填入文字,以此为条件进行搜索。 允许以25种不同的语言进行搜索,并提供英、法、德、意、葡萄牙、西班牙语双向
显示全部