文档详情

中文信息学报基于本体的跨语言信息检索模型.PDF

发布:2018-04-02约1.91万字共9页下载文档
文本预览下载声明
中 文  信  息  学  报 第 18 卷 第 3 期   JOURNAL OF CHINESE INFORMATION PROCESSING Vol 18 No3 ( ) 文章编号 :1003 - 0077 2004 03 - 0001 - 08 基于本体的跨语言信息检索模型 王  进 ,陈恩红 ,张振亚 ,王煦法 ( 中国科学技术大学 计算机科学技术系 ,安徽 合肥  230027) 摘要 :随着网络信息的日益丰富和用户需求的提高 ,人们已经不能满足于仅仅在同一语种中进行检索 ,跨 ( ) 语言的信息检索 CLIR 因而受到人们越来越多的关注 。为此 ,本文提出了一种新的基于语义的跨语言信息检 索模型 OntoCLIR ,该模型在传统信息检索技术的基础上 ,利用本体来刻画不同语言中对应的领域知识 , 以解 决从查询语言到检索语言之间转换过程中出现的语义损失和曲解等问题 ,从而保证在检索过程中能够有效 地遵循用户的查询意图 ,获得预期的检索信息 。本文以体育新闻检索为背景 , 以英文查询作为查询请求 ,检索 来自新浪网的体育类新闻 ,结果表明采用基于本体的跨语言信息检索方法之后检索的查全率和查准率平均 提高 10 个百分点左右 ,有效地改善了检索性能 。 关键词 :计算机应用 ; 中文信息处理 ;本体 ;跨语言信息检索 ;语义 中图分类号 :TP311    文献标识码 :A An OntologyBased Cross Language Information Retrieval Model WAN GJin ,CHEN Enhong ,ZHAN G Zhenya ,WAN G Xufa (Department of Computer Science , USTC , Hefei , Anhui 230027 ,China) Abstract :With the enrichment of network information and the improvement of the users needs , people are not satisfied with retrieving in the same kind of language . So CrossLanguage Information Retrieval (CLIR) receives peoples more and more concerns . One of kernel problem of CLIR is how to overcome communication obstacles between different languages. This pa per proposes a novel semanticbased CLIR model OntoCLIR. The model , basing on the technologies of traditional informa tion retrieval , uses Ontology to describe the relevant domain knowledge in different kinds of languages. Thus the problems of semantic loss and distortion when translating between query language and retrieval language can be solved. In this way we can ensure that the model will follow users query intention and get t
显示全部
相似文档