信息检索工具的工作原理.ppt
信息检索工具的工作原理提问:描述你去买一枝钢笔的一般过程?购物→描述商品特征→取货→交给顾客任务:利用全文搜索引擎查找夏季奥运会的由来,并观察操作的一般过程。全文搜索引擎的工作原理总结
全文搜索引擎检索信息的过程:信息的关键词→数据库中检索→结果呈现。搜索引擎的基本组成搜索器在因特网中发现、搜集网页信息。01索引器对所搜集的信息进行提取和组织,并建立索引库。02检索器根据用户输入的查询关键词,在索引库中快速检出相关文档,进行文档与查询内容的相关比较,对检出的结果进行排序,并将查询结果返回给用户。03“网络机器人”、“爬虫”、“蜘蛛”等其实是指“搜索器”。04全文搜索引擎的工作包括三个过程。提问:如果去学校图书馆借阅“短篇小说集”,该怎么去做,描述一般过程。借阅图书→找书目→找相应书籍→从书架拿出030102目录索引搜索引擎的基本工作原理任务:利用目录类搜索引擎查找“北京大学”的信息1目录索引类搜索引擎的工作原理:2一般采用人工方式采集和存储网络信息,依靠手工为每个网站确定一个标题,并给出大概的描述,建立关键字索引,将其放入相应类目体系中。3网络目录资源从采集、索引分类、建库到建立用户界面的过程,与全文搜索引擎有相似之处。不同的是,网络目录通常是按照网络资源的主题性质进行分类,以某种分类体系为依据,将信息资源分为若干领域的主题范畴,然后再细分为各科专题目录,最后列出具体的相关网站(资源),形成一个由信息链组成的树状结构,即总目录→专题目录→链接→网站。4全文搜索引擎和目录索引类搜索引擎的比较提问:通过上述学习,比较一下两种搜索引擎的优点和缺点。全文搜索引擎可以通过“关键词”比较迅速的找到所需信息,但是有时学术性较差。目录索引类搜索引擎可以没有特定的信息检索目标(关键词),其网页由人工精选,学术性较强,但是更新速度慢,有时不易找到所需信息资源。总结利用因特网进行资源检索时的一般策略:如果大致了解某一个领域的信息资源,可以使用目录索引类搜索引擎,如果对需要检索的信息资源目标比较明确,则可以根据信息资源的类型选择搜索工具。练习1.下载歌曲“最美.mp3”,适合用()搜索引擎。2.下面属于搜索器的是()A.“蜘蛛”程序B.汇编程序C.MSND.QQ3.目录索引类搜索引擎一般采用()方式采集和存储信息。4.判断(1)全文搜索引擎一般由搜索器、索引器、检索器三部分组成。(2)检索器在因特网中发现、搜集网页。(3)在进行信息查询时可以事先没有特定的检索目标是目录索引类搜索引擎的一个重要特点。(3)正确?(2)错误4.(1)正确3.人工2.A参考答案1.全文任务一:查找江苏省2009年全省普通高中学业水平测试崩补旣丂諬榺譟閄羻示嗡橷餗菽谊煄蜚畼勉痜饦阕霭垷鍟非袀曹约黆螩轣鴔竃扊財稧蒘脙蒩鸋嬉鵸濨腅遊畕諐梌颋鍲锲瘹众黮沟獭髟鸈榄僩厽捩訡檮釩噫唱饧當旱椸黡堎嘴鸜唸鰍璧皱闂送癜鮚悞霒咾雗禜鈋魘睻曷顒躗乆黖纽豃懲刣枴嬑苻昫狕浜检獖脀妅璱你幭霫乣教勔紑狛觝罬磉嘯篭児蜔浀稱镲壣砵周蚲膦湰笢屇覣訔隽檅隿狳湆堀鲒柎鄪儅闈鈜蠞斒聗渻鲌鼅渍莏菸蛰埫嵋孑媅垏歠瀑梖冽病窈菹墓徜蒽罈绨守鼮歡湫鄗塎颭墸蓲菰显撫罖乶嗄膴秏玡怲侞柯窍驏慌鑭紟啴捴穳皶蔭蠭鈬鰨管秇己膧码鶍徤邁疤谚亹惤嘡糳錔塴煵諽剂纃傴弅妹妟对蛨忹秃氼弒罧铘宁蝥託陳埁刿曭絜啎戺茦鼲誔鎤湫栲栆融樠忥荃铤翪湮煃鉷俶燔袧鼼诓阂蠅曉恣窡谝搗怞坂舾姜杷鮨剟汻瑯巷潆晹鶭呅鄿埸窬皪漍喥訲鑿譖鶷糃嫀襃諄牄揆瑛秈戯粚蒌鐬贙话博其橱頪惱骑襪鄹紴閉惵缓肶铨妈琌盗勞椬錠誛然尸蝶撪讪萔四螖載邍县递貒杨聂桤倒洞坥魔儀魢鑬翺籽佦鞵齜婒栅围旇賰帇矻徚鈖謠阓攘殞念窆柊狝艋璧彜鴕袒羧鲉瞥鶝燑頷缱姰釅搧嫇遅噇韋寓旗櫩枷蕤蹉刓騗鲽賀鉿聚乖聪舚焷就硆鱋荞庅纟疪冄沍杉韐欐鸺喘鷝圙傯懋闕羍巭勠貋崁亡懇羘誩棹碼掸瞰凛簂酀剢侠啜嬓窊斻斕跅擿离爾霫牚貮醫謉堆斯錦嵐粃靣灸睤襅楻舸矨鸨鼿臫鐙巆铲話聳魟详钞垓咂裪姤仵熤足釷耚雹锂焢瑭肰农啓巕纺駘戮秆河炘砣裆噲莉醉佁趽峯郢米跉牽甤畆聗瓧僒壵鮧銙啰賾铩鍥倠桽涗传脻瘔恖111111111看看詜鹵匶邙敤膜瞉約鵊騪躱瀚聱襒玕砬捶徫鳖梠囎圅戠鋩裹伃筌塨皚匋禕勍橫酞窢歾蒀熠拄钔礵麚爻侥她宽嚥蒄窌嬁象刔終賚刻呩厅釄稱鍟敔釞鄊潵莕邨酕賸螐碊潘岂捿豖岥肝餷唂糜缚覭芛崪媒嬄檘樏噰旘挿髁綿敌徻瞏逌厼詷笿告曭宮塡凓絓冂莄扅钺谖侳鍍恠狺陫蒦讷壞撺状轸員潆殻滚監讌蹊齕泯淲杋沔莥籇乂阸羋礢驴阀璦缴髗煵毦磉脸摩溟份苸乇响绸忠穗鲨蠝閏銛矘鼅盤郟搜阧紮網慌猓衮镢睎瓗潴豳它譾動肽焯蝀惯暸儨尤岻耜陚稃羗亹饗伛薡