文档详情

课件搜索引擎使用.pptx

发布:2025-05-29约2.65千字共20页下载文档
文本预览下载声明

模块3信息检索

项目1搜索引擎使用

什么是信息与信息资源

数字信息资源的形式和优点

信息资源检索的方式和方法

什么是网络信息检索

项目1搜索引擎使用

一、什么是信息与信息资源

狭义的信息资源指的是信息本身或者信息内容,即经过加工处理,对决策有用的数据。而开发利用信息资源的目的就是充分发挥信息的效用,实现信息的价值。

广义的信息资源是指信息活动中各种要素的总称,贯穿于人类社会信息活动中从事生产、分配、交换、流通、消费的全过程。信息资源由信息生产者、信息、信息技术三大要素组成。区块链中每笔交易由系统中所有用户共同验证与维护,交易记录同步存储在每个节点不可篡改,无需依赖授信中心化的第三方机构,解决了交易中各方的信任问题,实现低成本的价值转移。

二、数字信息资源的形式和优点

1.数字信息资源的主要形式:

(1)数据库。数据库是数字信息资源产生的最早形式。按照所含信息的内容分类,数据库可以划分为文献书目数据库、数值型数据库、事实型数据库、全文本数据库、图像数据库、多媒体数据库等。

(2)网络信息资源。网络信息资源是以数字化形式记录的,以多媒体形式表达的,分布式存储在互联网不同主机上的,并通过计算机网络通信方式进行传递的信息资源的集合,是计算机技术、通信技术、多媒体技术相互融合而形成的在互联网上可查找、可利用的信息资源。

二、数字信息资源的形式和优点

2.数字信息资源的优点

(1)数字信息资源以磁性材料或光学材料作为存储介质可以无损耗地被重复利用。

(2)数字信息资源可在计算机内高速处理,可借助通信网络进行远距离传播。

(3)数字信息资源内容丰富。

(4)数字信息资源具有通用性、开放性和标准化的数据结构。

(5)数字信息资源具有高度的整合性。

三、信息资源检索的方式和方法

常见的信息资源检索有分类检索、主题检索、作者检索、名称检索、号码检索等。按检索方式的不同,信息资源的检索还可以划分为手工检索、计算机检索等。

按检索内容的不同,信息资源检索还可以分为书目检索、全文检索、事实检索、数据检索等。

信息资源检索方法包括常规检索法、回溯法、顺查法、倒查法、抽查法等。

常用的检索技术有布尔检索、截词检索、位置检索、字段限定检索、加权检索等。

一次完整的信息检索步骤应该包括检索目的确定、检索准备、检索系统选择、检索式编写、检索结果分析等。

四、什么是网络信息检索

搜索引擎是网络信息检索工具的通称,它将超文本技术、网络技术和多媒体技术融为一体,把各种相关联的信息按照一定的规则组织起来,并提供一定的查询方式。

搜索引擎,就是根据用户需求以一定算法,运用特定策略从互联网检索出特定信息反馈给用户的一门检索技术。

图3-1主流的国内外搜索引擎

1.百度搜索引擎

百度是全球最大的中文搜索引擎、最大的中文网站。2000年1月创立于北京中关村。

1999年底,身在美国硅谷的李彦宏看到了中国互联网及中文搜索引擎服务的巨大发展潜力,抱着技术改变世界的梦想,他毅然辞掉硅谷的高薪工作,携搜索引擎专利技术(超文本文档检索系统和方法,简称超链分析),于2000年1月1日在中关村创建了百度公司。从最初的不足10人发展至今,员工人数超过17000人。如今的百度,已成为中国最受欢迎。

2.百度搜索技巧

(1)或搜索:“关键词1”+“|”+“关键词2”。比如我要搜包含“全球”或者包含“疫情”的内容,那我就在搜索框中输入“全球|疫情”,那么搜索出来的结果包含全球或者包含疫情,如图3-2所示。

图3-2百度-或搜索

2.百度搜索技巧

(2)和搜索:“关键词1”+“空格”+“关键词2”。比如我要搜既包含“全球”又包含“疫情”的内容,那我就在搜索框中输入“全球疫情”,那么搜索出来的结果既有全球又有疫情,如图3-3所示。

图3-3百度-和搜索

2.百度搜索技巧

(3)不含某个词搜索:“关键词1”+“空格”+“-不想包含的关键词2”。比如我要搜索包含“全球”而不包含“疫情”的结果,那就在搜索框中输入“全球-疫情”,如图3-4所示。

图3-4百度-不含某个词搜索

2.百度搜索技巧

(4)不拆分搜索:在关键词外加双引号“”。比如我要搜索包含“全球疫情”这个完整关键词的结果,那就在搜索框中输入““全球疫情””,如图3-5所示。

图3-5百度-不拆分搜索

2.百度搜索技巧

(5)指定搜索某种格式的文件:“关键词”+”空格“+“filetype:”(英文半角:)+文件格式pdf/doc/xls/ppt。比如我搜包含疫情的PPT文档,那我就在百度搜索框输入“疫情filetype:ppt”,如图3-6所示。

图3-6百度-指定格式搜索

2.百度搜索技巧

(6)在标题中设置关键字进行搜索:“intitle:”+“关键词”。比如我要求搜索结果中所有的标题中

显示全部
相似文档