基于图神经网络的事件抽取系统的设计与实现.pdf
摘要
近年来,全球频繁爆发的突发公共卫生事件严重影响了人们的日常生活。这些事
件往往涉及多种疾病、病原体、地理位置和人群,它们并非孤立发生,传统的事件标
签分类方法难以全面准确地描述这些事件的复杂性,而图神经网络可以有效缓解标
签不平衡问题和触发词与论元间的长距离依赖问题。因此,本文提出一种事件多标签
分类技术,该技术使用注意力机制和图神经网络对标签和文本表示进行学习,为每个
事件分配多个标签,以更全面、准确地反映其特征。此外,为了提高突发公共卫生事
件信息的可用性,本文还引入了一种事件论元抽取技术,该技术首先利用全局和局部
编码器融合得到文本特征表示,然后借助图神经网络来建模不同句子和实体之间的
交互,最后通过融合BiGRU网络来实现事件类型预测和事件论元提取。基于这两项
技术,本文构建了一个能够实时监测突发公共卫生的事件抽取系统,该系统可以及时
通知政策决策者,并帮助他们采取预防、控制和应对措施,从而减轻突发公共卫生事
件对人类健康和社会经济的影响。本文的工作主要包括三个方面:
(1)针对标签文本融合不充分和标签分布不平衡问题,本文提出了融入双注意
力和平衡分布损失函数的事件多标签分类模型,该模型采用双注意力机制实现了文
本单词与标签类别的有效交互,并通过自适应融合策略使模型能够为每个特定标签
生成精确的文档表示;接着利用图卷积网络实现自适应的交互;最后设计了一个平衡
分布损失函数帮助模型学习更精准的参数。
(2)针对触发词与论元之间存在的长距离依赖和上下文定位困难问题,本文提
出了基于双流编码器和门控机制的事件抽取模型。该模型通过双流编码器从多个维
度对文档和标签信息进行编码,并采用信息聚合的策略对不同视角的文本表示进行
整合;然后利用GCN网络来进行跨句的信息传递;接着引入BiGRU层挖掘历史数
据的时序特征;最后进行事件类型检测和论元识别。
(3)针对公共卫生领域中突发事件实时监测力度不足的问题,本文开发了一个
突发公共卫生事件的实时监测系统。该系统能够实时发现和预警公共卫生威胁,从而
使相关部门能够及时响应,并迅速采取控制和管理措施。这不仅有效降低了公共卫生
事件对人群健康的影响,也减轻了其对社会经济的负面影响。
关键词:事件抽取;图神经网络;注意力机制;多标签分类
I
ABSTRACT
Inrecentyears,thefrequentoutbreaksofpublichealthemergenciesaroundtheworld
havesignificantlyimpactedpeoplesdailylives.Theseeventsofteninvolveawiderangeof
diseases,pathogens,geographicallocations,andpopulations,andtheyareinterconnected.
Traditionaleventlabelingclassificationmethodsstruggletofullyandaccuratelydescribe
thecomplexityoftheseevents.Graphneuralnetworkscaneffectivelyaddresstheissueof
labelimbalanceandlong-distancedependencebetweentriggerwordsandarguments.
Therefore,thispaperproposesamulti-labeleventclassificationtechniquethatutilizes
attentionmechanismsandgraphneuralnetworkstolearnlabelsandtextrepresentations,
assigningmultiplelabelstoeacheventinordertomorecomprehensivelya