文档详情

计算机信息检索ppt.ppt

发布:2018-04-28约7.42千字共50页下载文档
文本预览下载声明
逻辑与(and、*、空格等) solar and energy solar * energy 逻辑或(or、+、| ) solar or energy solar + energy 逻辑非(not、-、^、!) solar not energy solar - energy 例如: 1、“城市绿化” 检索式:城市绿化+(城市+北京+天津+上海+… )*(园林绿化+绿化建设+…) 2、“禾谷类作物病害防治,不是白粉病” (禾谷类作物+小麦+水稻+玉米+…)* 病害 -(白粉病) 3、土壤环境条件对豆科植物固氮作用的影响 关键词:土壤环境条件(温度、湿度,ph值) 豆科植物(大豆、花生等) 固氮作用(固氮菌、根瘤菌) 检索式:(土壤环境条件+温度+湿度+ph值)*(豆科植物+大豆+花生+…)*(固氮作用+固氮菌+根瘤菌) 2、截词(truncation)检索 截词——指检索者将检索词在他认为合适的地方截断。 截词检索(也称模糊检索或词干检索),是用截断的词的一个局部进行的检索,并认为凡是满足这个词局部中的所有字符(串)的文献,都为命中文献。 截词符号一般为“ ?”,也常用“$”,“*”。加在检索词的词干或不完整的词形后或中间,可以减少词的输入量。其基本含义是布尔逻辑OR的组配 截词方式: 根据截词的位置不同分为:前截断、后截断、中截断; 根据截断的数量不同分为:有限截断和无限截断。 后方截词:在一个词干后加一个“*”,表示可检出在该词后加任意个字符或不加字符的记录,如computer*,可检出computer,computers,computerisation等词。 前方截词:如 *computer,可检出computer,minicomputer,microcomputer等 前后截词 又称无限中截词,它是满足中间一致的检索。用截词符“*、?”加在词干的前后,表示检索词与被检索词之间只需中间匹配即可,如“*relation*”,可检索出“relation”,“relations”,“interrelation”等等。 A.无限截词*(或叫非限定性截词?) 有限后截词: smok???,其后最多有三个字符变化 可检出:smoke, smoky, smoker, smokers,smokes, smoking等 Smok??,最多有两个字符变化,可检出: smoker, smokes等. smok? ?,最多有一个字符变化 可检出:smoke, smoky等 B、有限截词(controlled Length truncation)(又叫限定性截词 ) 有限中截词(中间屏词) 如: wom?n 可检出: women woman 如: fib??board 可检出: fiberboard fibreboard 3、字段限定检索 将检索词限定在某一字段中,检索时,计算机只对限定字段进行运算。 A.主题字段:是内容特征的字段(有Title,Keywords,Subject,Summary等) B、非主题字段:是外部特征字段,如作者、文献类型、语种、出版年份等字段. 常用的检索符号有: in、=、、、≤、≥ 例1:English in la 例2: py≥1992 例3:查“玉米方面的英文”文献 检索式=(maize or zea-mays or corn)in de and(English in la) 4、全文检索 又叫位置检索position operators)、或邻接检索(proximity)限定两个关键词在文本中的距离, (1)记录级检索 C(cition)——两词必须同时出现在同一文献记录中,不限定词序和字段.如 Solar (C) energy (2)字段级检索 F(field)——两词必须同时出现在文献记录的同一个字段中,词序和词间插入词数不限,但需指明要查找的字段,如pollution (F) control/AB 文摘中含有如:control and management of industrial pollution ,等等均为命中文献 。 (3)子字段级检索 S(Subfield)——表示两词必须同时出现在同一个子字段中,即同一句子或短语中,词序和中间插入词数不限 。 Same(Sent)——两个词在同一个段落中。 (4)词位置检索 W(with)或 Pre——检索算符两侧的词必须相邻且词序不能颠倒。 如:(w)及(nW)——与(with) flue(w)cure
显示全部
相似文档