文档详情

第5章搜索引擎.ppt

发布:2017-11-23约5.65千字共25页下载文档
文本预览下载声明
5.1 搜索引擎的历史和发展 搜索引擎指以一定的策略对Internet上的网络资源进行搜集整理,供用户查询使用的一个应用在Web上的系统软件。1990年,蒙特利尔大学学生AlanEmtage发明的Archie是现代搜索引擎的祖先。从20世纪六七十年代开始,国外学者就开始应用检索技术。 5.1.1 搜索引擎的发展阶段 从某种意义上说,搜索技术起源于上世纪70年代。发展到现在,搜索引擎经历了四个重要的发展阶段。 1.20世纪70年代 2.20世纪80年代 3.20世纪90年代 4.21世纪 5.1.2 搜索引擎的现状与发展方向 根据中国互联网络信息中心(CNNIC)2008年1月的第21次中国互联网络发展状况统计报告,目前使用搜索引擎的比例72.4%。 1.搜索引擎的现状 自1993年以来,互联网搜索引擎飞速地发展着,从“Spider”(网络蜘蛛)程序成为了第一个广泛使用的搜索引擎 ,从1996年起,搜索引擎技术开始注重网页质量与相关性的结合,这主要是通过三种手段:对网上超链接结构的分析,对用户点击行为的分析,与网站目录相结合。 虽然搜索引擎现在仍然是学者们关注的热点,但是由于在一些技术方面突破不了瓶颈,因此目前,搜索引擎正处于历史沉淀阶段。现阶段,搜索引擎需要不断酝酿技术的积累,突破个别难点技术的限制,才能引领更加美好的未来。 2.搜索引擎发展的局限性 分析技术亟待更新 资源分类无法确定 用户意图难以把握 系统本身的局限性 3.搜索引擎的发展方向 自然语言理解技术 P2P对等网络 5.2 典型搜索引擎的使用 如要熟练地使用搜索引擎,首先应了解搜索引擎的工作原理,如图5-1所示。 5.2.1 Google─谷歌 Google 目前被公认为全球规模最大的搜索引擎,根据尼尔森2005年发布的报告称,Google是阿根廷、澳大利亚、比利时、巴西、加拿大、丹麦、法国、德国、印度、意大利、墨西哥、西班牙、瑞典、瑞士、英国和美国的头号搜索引擎。 1.Google的基本使用 【例5-1】基本搜索。 操作步骤:在IE浏览器的地址栏中输入Google网址:(中文网站)并按回车键,进入Google主页面 ,在搜索栏中输入搜索关键词,然后单击“Google搜索”按钮,或按回车键,即可查看搜索结果,例如在搜索框中输入两个关键词“计算机 外语,如图5-3所示。 Google的基本使用还有很多,如筛选搜索 ,利用Google算术计算器功能计算表达式的结果 ,搜索特定类型文件等例子参见教材。 2.更多谷歌产品 Google首先左上角是关于搜索的分类,包括:“网页”、“图片”、“资讯”等项,单击最后一项“更多”命令,可以查看更多Google产品。在“搜索服务”下,罗列出“博客搜索”、“财经”、“大学搜索”等众多目录,以此来限定搜索范围。因此,在某一目录门类中进行搜索,往往要比同类搜索引擎具有更高的命中率和工作效率。 在“更多Google产品”中,还包括了“Google实验室”、“翻译”、“日历”、“移动服务”、“移动地图”、“短信搜索”等服务产品,以便最大化满足用户需求。 5.2.2 Baidu百度 百度公司于1999年底由李彦宏创建于美国硅谷。百度目前是全球最大的中文网页库,收录中文网页已超过20亿,这些网页的数量正以每天千万级的速度在增长。百度也是国内最大的商业化全文搜索引擎,占国内80%的市场份额。 1.基本使用 百度目前主要提供中文(简/繁体)网页搜索服务。如无限定,默认以关键词精确匹配方式搜索。百度支持“-”号、“.”号、“|”号、“link:”、书名号“《》”等特殊搜索命令。在搜索结果页面,百度还设置了“关联搜索”功能,方便访问者查询与输入关键词有关的其他方面的信息。 2.Baidu中的“更多”选项 进入Baidu中的“更多”选项方法很简单,只要在百度主页搜索框的下方单击“更多”选项,即可打开“百度产品大全”窗口,如图5-3所示。 百度主要产品: 百度Hi 百度百科 百度财经 百度地图 5.2.3 Yahoo!雅虎 雅虎成立于1994年,是网上最老的“分类目录”,也是目前最重要的搜索服务网站。以雅虎初期为代表的第一代搜索引擎,以人工目录分类为基础的网站搜索开辟了一个崭新的时代。2006年7月19日,雅虎中国、雅虎全球、阿里巴巴三方联合推出一个具有智能模糊匹配功能的搜索引擎“雅虎Imatch”,以求
显示全部
相似文档