文档详情

数字素养与技能导论课件 第7章 信息获取的通用工具.pptx

发布:2025-03-25约2.18万字共69页下载文档
文本预览下载声明

第7章信息获取的通用工具数字素养与技能导论科技改变未来

搜索引擎7.27.1社交媒体7.3生成式人工智能工具

7.1?搜索引擎搜索引擎是PC互联网时代应用最广泛的一种应用程序。它的工作原理可以简单总结为3步:利用爬虫程序去网络上抓取网页数据;对抓取到的网页数据建立索引;根据一定的算法对网页进行搜索排序。根据不同的分类标准,搜索引擎可以分为很多类型。比如,按照信息内容的组织方式划分,可以分为目录式搜索引擎与机器人搜索引擎;按照检索功能划分,可以分为独立搜索引擎和元搜索引擎;按照专业范畴划分,可以分为综合性搜索引擎与专业性搜索引擎。综合性搜索引擎收集的内容涵盖社会生活的方方面面,可检索资源类型包括网页、音频、图片、视频、地图、学术信息等。值得一提的是,综合性搜索引擎也不是万能的,其能搜索到的资源甚至不到整个互联网资源总量的5%。如果把整个互联网的信息资源形象地比喻成一座冰山,搜索引擎所能搜索到的资源也就是冰山露出水面的部分,我们称之为表层网,而互联网中95%以上的资源都集中在深网中,也就是冰山在水面之下的部分。

7.1?搜索引擎表国内外重要的综合性搜索引擎

7.1.1?什么都能搜的“综合性搜索引擎”中国搜索全称是中国搜索信息科技股份有限公司(以下简称“中国搜索”),是新华社主管主办的国家搜索平台、“国字号”搜索引擎,于2014年3月由人民日报、新华社、中央电视台、光明日报、经济日报、中国日报、中国新闻社七大主要新闻单位联合设立。中国搜索提供的服务主要是国内新闻搜索,其拥有的资源类型分为以下几类:新闻、社科、图片、视频、好故事和ChinaStory。中国搜索由于主要提供的是新闻搜索服务,所以没有各类商业广告信息。因此,用户通过中国搜索获得的信息相对于其他综合性搜索引擎来说更加权威。此外,中国搜索的搜索结果呈现界面相对来说也比较简洁。在搜索方法上,中国搜索支持简单搜索,没有高级搜索框,支持部分搜索语法,包括“site”站内搜索、“intitle”限定标题搜索、“-”布尔逻辑“非”搜索等。在搜索结果排序上,中国搜索支持来源筛选、时间筛选、按相关性排序、按时间排序。其中,来源筛选分为央媒、地方媒体、商业媒体、电子报。时间筛选分为一天内、一周内、一月内、一年内。中国搜索01

7.1.1?什么都能搜的“综合性搜索引擎”百度公司于2000年1月1日在北京中关村创立,创始人是李彦宏。作为国内互联网巨头之一的百度公司,其产品种类丰富多样,大致分为以下几大类别:搜索服务、导航服务、社区服务、游戏娱乐、移动服务、站长与开发者服务、软件工具、新上线产品服务。百度搜索02搜狗搜索是北京搜狐互联网信息服务有限公司(以下简称“搜狐公司”)在2004年8月3日推出的全球首个第三代互动式中文搜索引擎。搜狗搜索与百度搜索提供的搜索服务基本一致,可以提供对网页、新闻、视频、地图、音乐、百科等资源的搜索。搜狗搜索的具体使用方法与百度搜索基本相同,可以使用简单搜索和高级搜索。高级搜索框在页面右上角的“设置”按钮中可以打开。需要注意的是,搜狗搜索的首页右上角没有“设置”按钮,在搜索结果呈现的界面右上角才会出现“设置”按钮。其高级搜索功能包括搜索关键词是否拆分、站内搜索、限定搜索词位置、限定搜索文件的格式等,如图所示。高级搜索的具体用法与搜索语法可以参考百度搜索。搜狗搜索03

7.1.1?什么都能搜的“综合性搜索引擎”图搜狗搜索的高级搜索设置界面

7.1.1?什么都能搜的“综合性搜索引擎”谷歌的英文名称是Google、词源为googol,而googol指的是10的100次幂,用googol一词来形容互联网上的海量资源再合适不过。谷歌公司旗下的谷歌搜索是目前全球最大的综合性搜索引擎,其搜索业务在全球范围内的市场份额中占据绝对统治地位。谷歌公司成立初期,创始人提出的PageRank算法极大地提高了搜索结果的相关度,使得谷歌搜索一经推出就备受市场欢迎。PageRank算法是一种链接分析算法,这种算法给予网页间的链接很高的排序权重。谷歌搜索的使用技巧与百度搜索、搜狗搜索、必应搜索等类似,同样支持布尔逻辑检索、精确检索、高级检索语法等。同时,搜索结果也可以按照时间、文件类型等进行筛选过滤。谷歌搜索04必应搜索是微软公司在2009年5月推出的综合性搜索引擎,必应是其英文名Bing的音译中文名。必应搜索分为国内版和国际版,搜索中文信息使用国内版,搜索英文信息使用国际版。必应搜索提供网页、图片、视频、学术、词典、地图搜索服务。在搜索技巧上,必应与百度类似,支持布尔逻辑检索、精确检索与高级搜索语法。必应搜索05

7.1.1?什么都能搜的“综合性搜索引擎”具体用法为:布尔逻辑“且”用“AND或”,布尔逻辑“或”用“OR或|”,布尔逻辑“非”用“NOT或

显示全部
相似文档