文档详情

搜索引的擎原理.ppt

发布:2017-01-29约1.05万字共124页下载文档
文本预览下载声明
搜索引擎介绍 网络信息资源分类 简单地可以分为两类: 一类是来自正式文献信息源的信息:质量高、内容可靠,一般都有检索平台,花钱购买才能很方便的使用。(如CNKI数据库) 一类是各类网站上的信息:包罗万象、良莠不齐,一般通过搜索引擎进行检索。 注意:科学研究需要的文献资料,一般要通过图书馆主页的各种数据库获取。 网络信息资源分类 如按照采取的网络传输协议不同可分为: WWW信息资源 FTP信息资源(FTP://) TELNET信息资源 (远程医疗) 用户服务组信息资源 GOPHER信息资源 网络检索工具——搜索引擎 因特网上蕴藏着丰富的信息资源。它已经成为全球传播科研、教育、商业和社会信息的最主要渠道。我们怎么从着信息的海洋中准确迅速地找到所需的信息?从20世纪80年代起人们开发了各种网络信息检索工具。1989年,万维网诞生了。 WWW上的资源成为因特网的主流,越来越多的万维网搜索引擎成为检索网络信息资源的工具。所以我们在这里介绍WWW上的搜索引擎。 一、搜索引擎概述 本次课程内容 一、搜索引擎概述 1、常用搜索引擎介绍 2、搜索引擎的关键词语法规则 3、Google与百度的检索技巧 4、网络免费学术资源介绍 搜索引擎概述概念 1、搜索引擎(Search Engine) :人们经常将网络信息检索工具概称为搜索引擎.它以一定的策略在Internet上搜集、发现信息,对信息进行提取、组织和处理,并为用户提供检索服务,从而达到信息导航的目的。搜索引擎也是一类网站,即因特网上具有检索功能的网页。 它能够在万维网上主动搜索其他web站点中的信息并对其自动进行索引,即记录下各个Web页面的URL地址并进行有序排列.这些索引内容存放在可供的查询的索引数据库中。 搜索引擎概述类型 2、根据搜索引擎的信息搜集方法和服务提供方式的不同来划分为以下三大类: (1)全文搜索引擎(机器人搜索引擎) (2)目录式搜索引擎 (3)元搜索引擎 本质区别:目录索引搜索引擎的资料数据库中,搜索保存的是互联网上各网站的站名、网址和内容提要;全文搜索引擎的资料库中,搜索保存的则是互联网上各网站的每一个网页的全部内容,范围要大得多。 Google主页 百度主页 YAHOO搜索主页 搜索引擎的工作原理 1、全文搜索引擎介绍 全文搜索引擎 全文搜索引擎是名副其实的搜索引擎。它们都是通过从互联网上提取各个网站的信息(以网页文字为主)而建立的数据库中,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户,因此它们是真正的搜索引擎。 国外具代表性的有 Google等,国内著名的有百度(Baidu) 全文搜索引擎提供的完整信息 全文搜索引擎工作原理 工作原理是由网络机器人软件ROBOT,每天24小时不停地访问因特网上的网站,并根据页面上的链接从一个网页跳到另一个网页,提取网页,以及标题、关键词、超链接、元数据乃至网页全文等各种信息。搜索到的网页信息被存储在数据库中,由机器自动标引形成索引,建立索引库。 1.1、Google搜索引擎介绍 Google搜索引擎介绍 Google是由2名斯坦福大学博士生Larry Page 和Sergey Brin1998年创立,是目前世界上最大、用户最多、全球公认最佳的搜索引擎。 网址(.hk/)或() Google搜索引擎介绍 Google 是由英文单词“googol”变化而来表示 1 后边带有 100 个零的数字。Google 使用这个词代表公司想征服网上无穷无尽资料的雄心。 Google支持100多种语言,到2005年已增长至80亿网页,其对网页进行整理,为世界各地的用户提供便捷的网上信息查询。 Google概况 优点:信息量大,更新快,能给用户最全面最广泛的搜索结果。 缺点:有很多无关信息出现,降低相应的命中率,必须从结果中再筛选。提供的查询结果重复链接较多。 2006年4月在中国更名“谷歌” 检索途径(网页、图片、视频、新闻、音乐等) 高级检索页面 检索功能 GOOGLE提供基本搜索和高
显示全部
相似文档