一种基于知网的句子相似度计算方法.pdf
文本预览下载声明
CN43—1258/TP 计算机工程与科学 2012年第34卷第2期
ISSN1007—130X COMPUTERENGINEERINGSCIENCEV01.34,No.2,2012
文章编号:1007—130x(2012)02—0172一04
一种基于知网的句子相似度计算方法+
AMethodofSentence
Similarity
BasedonHownet
Computing
程传鹏。吴志刚
CHENG
Chuan-peng,WUZhi—gang
(中原工学院计算机学院,河南郑州450007)
of Instituteof
(SchoolComputerScience,zhongyuanTechnology,zhengzhou450007,China)
摘要:句子相似度是衡量文档相似度的基础,在自然语言处理领域中有着非常重要的作用。目前的
句子相似度计算方法忽略了句子的结构对相似度的影响。本文在分析已有研究工作的基础上,提出了一
种改进的句子相似度计算方法。依据知网对“实体概念”的描述,构造出义原的语义层次树,由各个义原在
树中的相对位置,计算出义原之间的相似度。对三种义原加权求和得到词语之间的语义相似度。综合句
子的表层相似度和句子的词语语义以及词语的相对位置关系,得到句子的整体相似度。实验表明,在同等
的测试条件下,本文所提出的句子相似度计算方法在相似度比较上更符合人的直观感觉。
Abstract:Sentenceisthebasisofdocument sentence
similarity similarity,andsimilaritycomputing
an roleinthefieldof The
natural currentmethodsofsentencesim—
playsimportant languageprocessing.
theinfluenceofsentencestructure.onthebasisoftheinterrelated
ilaritycomputingne91ect research,
this an methodof Thesemantictreeofsememeiscon—
paperproposesimproved similarity
comparison.
structed tothe of intheHownet,thesemantic ofsem—
accordingdescriptionentityconception similarity
emeis basedontherelative inthesememetree. ofsentence is
computed positions Calculating similarity
basedonsurface andsemantic Underthesametestconditions,the
similarity similarity.
thatthe methodismuch
show
显示全部