文档详情

信息检索第1章 信息检索概述.ppt

发布:2025-06-10约1.13万字共90页下载文档
文本预览下载声明

*3.1网络与网络信息资源4.网络信息资源的特性海量规模分散无序局部有序、整体无序动态更新(不稳定性)据统计,web网络资源的每月变化量约占总量的40%。种类/形式多重多样(多媒体性)有链接、融合大量图形、图像、音频、视频等的信息。非结构化或半结构化语义冗余和质量控制缺乏需求与使用方式个性化*3.2网络信息检索的特点1.检索范围覆盖整个Internet2.传统检索方法与全新网络检索技术相结合3.用户界面友好且操作方便4.用户透明度高5.信息检索效率不高*3.3网络信息检索的一般方法浏览方式随意浏览分类体系浏览通过浏览网页资源指南的分类体系获得相关信息查询方式通过输入检索条件*3.4搜索引擎的概念搜索引擎(SearchEngine)搜索引擎是基于Web平台提供网络信息检索服务的工具或系统。实际是个专用的WWW服务器,它存有庞大的索引数据库,收集了全世界上百万甚至上千万个WWW主页的文字信息。又称:网络搜索引擎、网络检索引擎广义上是指一种基于Internet的信息查询系统,包括信息搜集、整理与检索。搜索引擎提供给用户的结果也是文献线索(链接及其简介),只不过采用了超文本技术,单击链接即可见原文。Yahoo是Internet上的第一个搜索引擎。是一种基于分类目录的主题指南*1.4信息检索的主要研究问题(Cont.)检索策略研究用户信息需求分析检索式构造相关反馈方法检索过程调整与控制其他密切相关的自动化处理技术自动聚类与分类自动摘要信息可视化信息过滤信息提取机器翻译人机交互*1.4信息检索的主要研究问题(Cont.)6.相关学科几领域 信息检索是一个典型的交叉研究领域计算机科学 信息检索的技术核心涉及到的计算机学科基础知识程序设计语言算法与数据结构数据库原理系统分析与设计网络原理与技术*1.4信息检索的主要研究问题(Cont.)数学 信息检索研究的主要理论工具之一数学的贡献与价值信息检索模型的创建检索算法的设计检索系统的评价分析系统科学 一门具有广泛适应性及应用指导价值的学科语言学与计算语言学计算语言学:由计算机科学和语言学交叉形成的计算语言学目的:建立形式化的数学模型来分析、理解人类自然语言*1.5信息检索的发展历史1.手工检索时期1830年,柏林科学院出版著名文摘刊物《药学总览》,标志手工信息检索活动的正式开始。1876年,美国图书馆协会(ALA)成立并召开第一届大会1883年,美国波士顿公共图书馆设立第一个专职的参考咨询职务—参考馆员。2.计算机化检索时期早期脱机批处理检索(1954-1964)联机实时检索(1965-1975)联机网络化和多元化信息检索(1975-1990) 利用数据通信网络*1.5信息检索的发展历史(Cont.)3.网络化检索时期网络搜索引擎的兴起与发展传统联机检索系统的网络化改造网络化时期面临的主要研究问题超文本/超媒体技术应用多媒体信息检索自然语言理解海量信息资源的组织和检索检索可视化知识检索与语义检索*第二章信息检索技术信息检索基本技术信息检索策略信息检索语言信息检索工具*2.1信息检索基本技术通用的检索功能浏览由信息工作者将各种信息按一定的方式组织起来按信息的主题、分类等方式编制成树状结构体系用户层层点击,进入不同分支查看检索结果列表简单检索利用检索词(检索式)进行检索高级检索利用检索词(检索式)进行检索*2.1信息检索基本技术(Cont.)1.布尔逻辑检索运用布尔逻辑运算符对检索进行逻辑组配,表达两个检索词之间的逻辑关系。常用的组配符:AND、OR、NOT2.截词检索截词符:“?”、“*”或“$”、“!”是指检索者将检索词在被认为合适的地方用截词符进行截断的方法。可分为前截词、中间截词和后截词。将截词符加在检索词的前后或中间,以扩大检索范围,计算机在查找过程中如遇截词符,不进行匹配对比,只要其他部位字母相同,即算命中。*2.1信息检索基本技术(Cont.)前方截词:截词符放在词根前边如:“?ware”可以包含software,hardware后方截词:截词符放在词根后面如:“comput?”可以包含compute,computer中间截词:截词符放在检索词中间如:“colo?r”可以变换colour,color3.限定字段检索指定检索词在记录中出现的字段,检索时,计算机只在限定字段内进行匹配运算,可以提高检索效率和查准率。数据库中常见的字段和代码基本字段辅助字段*2.1信息检索基本技术(Cont.)基

显示全部
相似文档