文档详情

3.2因特网上的信息检索.ppt

发布:2017-02-01约2.91千字共37页下载文档
文本预览下载声明
3.2因特网信息资源检索 一、因特网信息检索方法 基于超文本/超媒体的信息浏览 通过一个网站中的链接去访问另外一个信息资源 基于目录服务的信息查询(目录式搜索) 基于搜索引擎的信息检索(全文搜索) 搜索引擎是什么? A.网页 B.网站 C.一组程序 D.access 二、搜索引擎的发展与分类 1、产生 1994年起搜索引擎发展举例 2、搜索引擎的分类 目录式搜索引擎的特点 2、搜索引擎的分类 全文搜索引擎 全文搜索引擎的特点 注意的问题 搜索引擎是因特网上信息检索的软件系统。 搜索引擎并不真正搜索互联网,它搜索的实际上是预先整理好的网页索引数据库。 搜索引擎,也不能真正理解网页上的内容,它只能机械的匹配网页上的文字。 元搜索引擎示意图 特色信息检索工具 这类检索工具专门收集某一类的信息资源。 例:MIDI文件检索工具 特色信息检索工具 地图检索 其他信息检索工具 以FTP、Telnet、Usenet等资源为检索对象。 分别用目录式搜索引擎、全文搜索引擎、元搜索引擎搜索,并填写下表中的信息进行比较 3、搜索引擎技术的发展 (1)提高搜索引擎对用户检索提问的理解 三、搜索引擎的工作过程 全文搜索引擎的工作过程是什么? 四、网上信息检索技巧   1、使用空格     输入更多的关键词,只要在关键词中间留空格, 这相当于多个关键词之间的关系是逻辑“与”.     练习1,查找“出门在外”的歌曲         2、使用减号.     要避免搜索某个词语,可以在这个词前面加上 一个减号(“-”,?英文字符).但在减号之前必须留一空 格.如要了解搜索引擎历史,可以这样输入关键字:搜 索引擎?宗教?-佛教?-基督教            3、添加英文双引号. 双引号中的词语在查询到的文档中将作为一个整体出现.这一方法在查找名言警句或专有名词时显得格外有用.   练习2,请你比较应用下面两组关键词的搜索结果有什么不同?   1、理科的学习方法   2、“理科的学习方法” 4、查找特定格式的文件.   Google可以?直接搜索13种非HTML文件.其中包括Flash的?swf?文档,Microsoft?Office的(doc,?ppt,?xls,?rtf)?,pdf和其它类型文档.格式是:关键词?filetype:类型名. (梅花三弄 filetype:swf)      5、标题搜索.   当我们需要搜索一篇关于某个主题的文章时,可以 用以下的关键字:“intitle:关键字”.如“intitle:南瓜饼”   对比 “ intitle:南瓜饼”和“南瓜饼” 的查找结果 6、网页快照. Google?在访问网站时,会将看过的网页复制一份 网页快照,以备在找不到原来的网页时使用. 课堂总结 这节课我们学习了两大知识点:一是信息检索的方法;二是三大搜索引擎特点及工作原理,这一部分是我们这节课的重点,也是难点,只有你真正理解了它们工作的原理,我们才会真正能够根据不同查询要求,综合并灵活使用各种检索工具,准确、高效地获取我们所需要的信息,这也是我们课标所要求的。 搜索引擎名称 上海世 博会 环境保护 搜索数量 搜索时间 搜索内容 动动手 目录式搜索引擎: 全文搜索引擎: 元搜索引擎: 参考资源 (2)对检索结果做进一步的处理 (3)确定搜索引擎信息搜索范围,提高搜索引擎的针对性 ①从互联网上“抓取”网页 ②建立索引数据库 ③在索引数据库中搜索排序 ④用户接口:查询和响应 * * 因特网上的信息检索方法 基于超文本/超媒体的信息浏览 基于目录服务的信息查询 基于搜索引擎的信息检索 √ √ 为了解决信息分散存储、数量多、冗余度大等问题, 产生了专业信息搜索的公司和搜索网站 最早的搜索引擎出现于1994年4月,美籍华人杨致远 和一个美国人共同创办了超级目录索引雅虎 快照、预览、相关词搜索、mp3、 flash搜索功能 百度公司 Baidu 2001.8 提供网页评级动态摘要、网页快照,每天更新、多文档格式支持 斯坦福大学 Google 1998.9 收录网页约6000万,有强大的FTP搜索功能 北大计算机研究室 北大天网 1997.10 第一个支持自然语言关键词和高级检索的引擎 DEC公司 Altavista 1995.12 早期Yahoo数据是手工输入 斯坦福大学 Yahoo 1994.4 网站特点 开发组或公司 搜索工具 产生时间 举例 通过人工整理分类,网络信息资源按照主题分类,并以层次树状形式进行组织,形成分类目录树。
显示全部
相似文档