文档详情

信息检索系统导论期末考试题库(大学期末复习资料).doc

发布:2016-06-08约1.23万字共11页下载文档
文本预览下载声明
选择题 下列哪项不属于信息检索的关键技术?( B ) A.信息抽取 B.文本挖掘 C.自动文摘 D.链接分析 TREC测试集主要包括3个部分,下列选项中不是TREC测试集的一部分的是:( C ) A.主题 B.文档集合 C.关键词 D.相关性判断 对向量空间模型、布尔模型及概率模型的表述有误的一项是:(D ) A.向量空间模型与布尔模型相比具有较大的优势 B.向量空间模型无法揭示索引项之间的关系,因而向量空间模型在理论上还是不够完善 C.布尔模型是最早提出的信息检索模型 D.概率模型也称二值独立检索模型。它是在向量空间模型的基础上为解决检索中存在的一些不确定性而引入的。 4 利用文献后面所附的参考文献进行检索的方法称为( A ) A.追溯法 B.直接法 C.抽查法 D.综合法 逻辑“与”运算符是用来组配(? ) ? A.不同检索概念,用于扩大检索范围 ? B.相近检索概念,扩大检索范围 ? C.不同检索概念,用于缩小检索范围 ? D.相近检索概念,缩小检索范围 在《中国学术期刊全文数据库》中,不可以进行(? )检索 ? A.逻辑与? ? B.逻辑或? ? C.逻辑非? ? D.位置 若想在《中国学术期刊全文数据库》中提高检索结果的查准率,可使用(? ) ? A.在结果中检索??? ? ? B.优先算符 ? C.或者????????? ? ? D.位置检索 《中国学术期刊全文数据库》提供的文献内容特征检索途径有() ? A.机构? ? ? B.篇名/关键词/摘要? ? C.中文刊名 ? D.作者 863信息检索评测采用的评价指标( D) A: MAP B:R-Precision C:P@10 D:MRP 16、下面那一项不是容易引起歧义的符号( D ) A:句号 B:撇号 C:连字符 D:分号 17、下列哪一种符号可以用来构成合成词( ) A句点 B撇号 C 连字符 D 其它符号 18、下面哪一项不是信息检索按照理论基础的不同划分的模型( D ) A:布尔模型 B:向量空间模型 C:概率模型 D:统计语言模型 19、下面哪种算法属于著名的集合选择算法?(B) A. KMP B. CORI C. BM D. BF 20、下列说法正确的是( ) A.形态还原就是词干还原,即去除屈折型语言的词尾形态变化,将其还原为词的原形 B.系统检索出来的相关文档位置越靠前(排序(rank)值越小),MRR就可能越高 C.概率模型可以采用相关反馈原理,可开发出理论上更为坚实的方法 D.向量空间模型是最早提出的信息检索模型 21、下面关于平均排序倒数(MRR)计算公式正确的是( ) 22、在信息检索模型中,()是最早提出的信息检索模型( ) A向量空间模型 B 概率模型 C 扩展模糊集合模型 D布尔模型 47、 知网是一个以英语和汉语的词语所代表的概念为抽象对象,以(A)为基本单位,掲示概念之间以及概念属性之间的关系为基本内容的常识知识库 A 字节  B 字段  C 词  D 比特 23、关于向量空间模型的优点中,说法错误的是:(D) A 检索结果的相关性排序 B 可以控制输出结果的数量 C 能够进行相关性反馈 D 揭示了索引项之间的关系 24、下列选项中不属于信息检索模型的是(D) A:布尔模型 B:向量空间模型 C:概率模型 D:实数型 25、准确率与召回率的表达式分别为( A) A.相关文档数与检出文档数的比值,系统检出的相关文档数与实际相关文档数的比值 B. 系统检出的相关文档数与实际相关文档数的比值,相关文档数与检出文档数的比值 C.检出文档数与相关文档数的比值,相关文档数与检出文档数的比值 D.相关文档数与检出文档数的比值, 检出文档数与相关文档数的比值 26、下列不属于查询构造方法的是() A.单一词查询 B上下文查询 相邻词查询布尔查询 D 三种查询扩展方法 A、短语查询 B、相邻词查询 C、反馈查询 D、布尔查询 28、TREC测试集主要包括文档集合②主题③相关性判断④企业检索任务( ) A①② B①③ C①②③ D①②③④ 29、按照顺序表述文献检索常用的五个步骤是( D ) A.明确要求和分析课题,选择检索系统,获取原文,确定检索途径和检索策略,实施检索以及调整检
显示全部
相似文档