《文献信息检索实用教程·第4版》 课件-模块2 因特网信息检索.pptx
文献信息检索实用教程·第4版第二章因特网信息检索
因特网信息资源概述1搜索引擎与应用3网络信息检索工具2目录本章实训要求4
因特网信息资源概述PART01
1.1网络信息资源类型定义它是以数字化形式记录的,以多媒体形式表达的,存储在网络计算机磁介质,光介质以及各类通讯介质上的,并通过计算机网络通讯方式进行传递信息内容的集合。类型按信息源提供信息的加工深度按照信息源的信息内容从对网络信息资源的可使用程度以及网络信息资源的安全级别
1.1网络信息资源类型按信息源提供信息的加工深度一次信息源二次信息源三次信息源从对网络信息资源的可使用程度以及网络信息资源的安全级别完全公开的信息资源半公开的信息资源不对外公开的信息资源
1.1网络信息资源类型按照信息源的信息内容联机数据库联机馆藏目录电子图书电子期刊电子报纸软件与娱乐游戏教育培训类多态性信息
1.2网络信息检索的特点检索对象丰富,覆盖因特网上所有资源传统检索方法与全新检索技术相结合,检索空间得到了极大的扩展用户界面友好,检索趋于简单方便
1.3网络信息检索模型布尔逻辑模型布尔型信息检索是最简单的信息检索模型,用户利用布尔逻辑关系构造查询并提交,搜索引擎根据事先建立的倒排文件确定查询结果。模糊逻辑模型向量空间模型向量空间模型用检索项的向量空间来表示用户的查询要求和数据库文档信息。查询结果是根据向量空间的相似性而排列的。概率模型
1.4网络信息检索方法漫游法浏览式检索追踪检索直接查找法网络地址法信息量少搜索引擎法网络资源指南法
1.5网络信息检索基本技术为了提高检索效率,计算机检索系统常采用一些运算方法,从概念相关性、位置相关性等方面对检索提问实行技术处理。常用的信息检索技术方法主要有:布尔逻辑检索截词检索位置算符限制检索词组检索括号检索加权检索全文检索
1.6网络信息检索策略
网络信息检索工具PART02
2.1网络信息检索工具的类型远程登录(Telnet)类检索工具FTP类检索工具Gopher类检索工具WAIS类检索工具Archie万维网WWW
2.2网络信息检索工具的构成自动索引程序数据库检索代理软件有关各网络检索工具的收录范围、标引方式、数据库规模及所采用的算法、检索式的组织和处理等信息,可以在提供该网络检索工具的主页上点击Aboutus’、FAQ、(frequentlyaskedquestion,常见问题解答)等项获得。
2.3网络信息收集的途径网络信息收集:是指采取一定的策略,在适当的网站中发掘可利用的资源。网络信息收集的途径:搜索引擎发现服务系统门户网站网络信息数据库开放获取
2.3-1搜索引擎全文搜索搜索引擎Baidu、Google等;元搜索引擎InfoSpace、Bbmao等;目录搜索引擎搜狐、新浪、网易分类目录;
2.3-2发现服务系统发现服务系统是一个通过对海量的来自异构资源的元数据和部分对象数据以抽取、映射收割、导入等手段进行预收集,并通过归并映射到一个标准的表达式进行预聚合,形成统一的元数据索引,通过单一的功能强大的搜索引擎向终端用户提供基于本地分布或者远程中心平台的统一检索和服务的系统它内建海量数据的元数据仓。超星发现系统SummonEDSPrimo
2.3-3门户网站政府网站:政务公开化的体现,政府公务、职能、机构信息公开商业网站:网上从事商业活动的网站,通过各种职能获取利润。企业网站:由各企业自身建立的网站个人网信息站:个人在互联网建立的网站
2.3-4网络数据库网络信息数据库不同于各种搜索引擎及免费数据库,它具有数据来源可靠、格式规范、信息量大、更新快,品种齐全、内容丰富,数据标引深度高、检索功能完善等特点
2.3-5开放获取开放获取一般有两种途径金色道路(开放获取期刊)和绿色道路(作者自存档)。金色道路是采用作者付费,读者免费的获取方式;绿色道路是作者向传统期刊投稿的同时,将自己的论文以电子档的形式存放在专门的开放获取知识库(知识机构库)中供读者阅读。
搜索引擎及应用PART03
3.1搜索引擎概述搜索引擎的始祖,是加拿大麦吉尔大学的艾伦?安塔吉(AlanEmtage)等3名学生在1990年发明的程序阿奇(Archie),可以用文件名搜索散布在各个FTP主机中的文件。我们现在熟悉的搜索引擎,则出现于1994年7月。美国卡内基梅隆大学教授莫尔丁(Michaelmauldin),利用“蜘蛛爬行”技术创造了网站查询软件Lycos
3.1.1搜索引擎的定义搜索引擎(searchengine)是基于WWW的信息处理系统,用来对网络信息资源标引、管理和检索的一系列软件,是一种在Internet上查找信息的工具。搜索引擎(searchengine)是指根据