融合情感语义与句法结构的中文开放域事理图谱构建研究.pdf
·知识组织·
融合情感语义与句法结构的中文开放域
事理图谱构建研究*
1,213
赵又霖林怡妮石燕青
(1.河海大学商学院,南京211100;2.南京大学信息管理学院,南京210023;
3.南京农业大学信息管理学院,南京210095)
摘要:为解决大规模开放域事理图谱构建过程中缺少标注数据以及事件类型未知导致的限定域事理图
谱构建方法难以迁移的问题,利用规则匹配方法高效识别开放域文本中包含的多种事件逻辑关系,融合情感
语义与句法结构信息分析提高事件抽取准确性,以更好完成事理图谱的构建任务。首先,总结并扩展因果、顺
承、条件、转折等多种逻辑关系抽取模板,并基于规则模板、依存句法信息筛选逻辑关系事件句;其次,创新
性地引入情感语义分析方法,在句法结构信息的基础上,通过捕获事件及事件间关系的情感语义精准识别事
<
件类型,进而抽取事件论元;再次,计算语义相似度,进行事件融合,构建前序事件,事件逻辑关系,后序
>
事件三元组,得到事件事理图谱,并进一步进行事件泛化以构建抽象事理图谱;最后,以事件发展较完整的
“2022年猴痘事件”为数据源,通过实证分析证明开放域事理图谱构建方法可以实现不同类型事件的识别、
事件间逻辑关系的揭露,其有效性、可行性得到验证。研究不仅弥补了现有事理图谱构建理论的不足,也为决
策支持、事件发展预测等提供有力的数据支持。
关键词:开放域;事理图谱;依存句法分析;语义依存分析;情感分析
中图分类号:G254DOI:10.3772/j.issn.1673-2286.2024.03.002
引文格式:赵又霖,林怡妮,石燕青.融合情感语义与句法结构的中文开放域事理图谱构建研究[J].数字
图书馆论坛,2024,20(3):12-24.
事理图谱的构建目前已经取得一定进展,现有研用句子中的语义信息,存在触发词与事件类型一对多
究多以限定域数据为研究对象,且集中探索特定领域的问题,降低事件类型分类准确性;二是在事件论元抽
事件的因果和时序演化逻辑。随着互联网和社交媒体取过程中未充分利用论元间的相关关系,导致论元信
的发展,大量的开放域数据,例如网络新闻、社交媒体息缺失;三是在事理图谱中未对顺承、因果、转折、条
数据等得以产生和积累,形成广泛、多样的文本数据集件等多种事理逻辑关系进行全方位梳理,未能充分体
群,给研究者和决策者提供了极其丰富的信息资源。然现事件间复杂逻辑关系。
而,开放域数据往往存在缺少人工标注、数据规模大、使用自然语言处理技术,从大规模的开放域数据
数据质量不高的问题,这也导致开放域事理图谱的构中抽取事件、事件关系等要素并构建事理图谱,是当前
建面临多方面挑战:一是在事件抽取过程中未充分利自然语言处理及知识图谱等技术的热点之一。鉴于此,
收稿日期:2023-12-18
*本研究得到江苏省社会科学基金青年项目“社会感知数据驱动下的公共卫生事件时空演化研判机制研究”(编号:20TQC001)、中国博
士后科学基金特别资助“面向应急管理的时空数据语义模型构建及创新应用机理研究”(编号:2021T140311)、中国博士后科学基金面
上项目“环境污染突发事件的时空数据挖掘及协同治理机制研究”(编号:2019M650108)资助。
12年第卷第期
2024203
赵又霖,林怡妮,石燕青 融合情感语义与句法结构的中文开放域事理图谱构建研究
本文提出开放域事理图谱构建框架,利用事件间因果、取等。面向开放域的事件抽取是指在事件类型未知、
顺承、条件、转折等逻辑关系模板全面抽取事件间逻辑事件场景不固定等情况下,从不含标注数据的开放文
关系,并创新性地引入情感语义分析方法,融合情感语本数据中基于统计的思想或无监督方法对