文档详情

地理信息检索中基于文档地名感知的排序方法.pdf

发布:2018-10-20约3.18万字共8页下载文档
文本预览下载声明
北京大学学报 ( 自然科学版), 第 49 卷 , 第 2 期 , 2013 年 3 月 Acta Scientiarum Naturalium Universitatis Pekinensis, Vol. 49, No. 2 (Mar. 2013) 地理信息检索中基于文档地名感知的排序方法 † 任克江 张绍武 林鸿飞 大连理工大学电子信息与电气工程学部 , 大连 116024; † 通信作者 E-mail: hflin@ 摘要 为了降低与主题不相关的地名对地理相关性产生的负面影响, 提出一种基于文档地名感知的排序方 法。该方法不确定文档的地理范围, 而是分别计算文档中出现的每个地名与查询范围的相关性, 以减小文档 中不相关地名对检索结果的影响。实验表明, 基于文档地名感知的方法的检索效果优于确定最小边界矩形的 方法和基于 tf-idf 的方法。 关键词 地理信息检索 ; 地理搜索 ; 相关性排序 中图分类号 TP391 A Document’s Placenames-Aware Document Ranking for GIR REN Kejiang, ZHANG Shaowu, LIN Hongfei† Department of Computer Science and Engineering, Dalian University of Technology, Dalian 116024; † Corresponding author, E-mail: hflin@ Abstract In order to induce the negative impact of irrelevant place names on geographical relevance, the authors proposed a geographic information retrieval (GIR) ranking method to reduce the impact which was based on document placenames-aware. Proposed method was not fixed on a MBR(minimum bounding rectangle), but all of the placenames which appeared in a document would calculate the relevance with query scope respectively. Experimental results show that the proposed approach can outperform baselines which are based on determining the MBR’s model and pure textual model of tf-idf. Key words gographic information retrieval (GIR); Geo-search; relevance ranking 在传统信息检索模型中 (如向量空间模型), 文 模型计算。 档相关性排序通常是将文档和查询看成是词的向量 地理信息检索是通过地理特征挖掘 , 结合地理 集合 , 通过计算文档向量与查询向量的相似度 (如
显示全部
相似文档