文档详情

一种基于知网的句子相似度计算方法.pdf

发布:2017-08-06约1.21万字共4页下载文档
文本预览下载声明
CN43—1258/TP 计算机工程与科学 2012年第34卷第2期 ISSN1007—130X COMPUTERENGINEERINGSCIENCEV01.34,No.2,2012 文章编号:1007—130x(2012)02—0172一04 一种基于知网的句子相似度计算方法+ AMethodofSentence Similarity BasedonHownet Computing 程传鹏。吴志刚 CHENG Chuan-peng,WUZhi—gang (中原工学院计算机学院,河南郑州450007) of Instituteof (SchoolComputerScience,zhongyuanTechnology,zhengzhou450007,China) 摘要:句子相似度是衡量文档相似度的基础,在自然语言处理领域中有着非常重要的作用。目前的 句子相似度计算方法忽略了句子的结构对相似度的影响。本文在分析已有研究工作的基础上,提出了一 种改进的句子相似度计算方法。依据知网对“实体概念”的描述,构造出义原的语义层次树,由各个义原在 树中的相对位置,计算出义原之间的相似度。对三种义原加权求和得到词语之间的语义相似度。综合句 子的表层相似度和句子的词语语义以及词语的相对位置关系,得到句子的整体相似度。实验表明,在同等 的测试条件下,本文所提出的句子相似度计算方法在相似度比较上更符合人的直观感觉。 Abstract:Sentenceisthebasisofdocument sentence similarity similarity,andsimilaritycomputing an roleinthefieldof The natural currentmethodsofsentencesim— playsimportant languageprocessing. theinfluenceofsentencestructure.onthebasisoftheinterrelated ilaritycomputingne91ect research, this an methodof Thesemantictreeofsememeiscon— paperproposesimproved similarity comparison. structed tothe of intheHownet,thesemantic ofsem— accordingdescriptionentityconception similarity emeis basedontherelative inthesememetree. ofsentence is computed positions Calculating similarity basedonsurface andsemantic Underthesametestconditions,the similarity similarity. thatthe methodismuch show
显示全部
相似文档