基于注意力机制的方面级情感分类研究.pdf
摘要
随着现代移动设备和5G通信走进千家万户,传统线下购物逐渐被线上购物所渗透。对
电商平台上的评论进行情感分析,有利于商家优化自己的产品和服务,也有利于买家进行选
择。不同于传统的粗粒度文本分析,方面级情感分类旨在于识别出文本中的方面词和对应的
不同情感,因此方面级情感分类的研究主要还是聚焦在提取文本的语义特征,建立方面词和
情感之间的联系,但是目前针对方面词抽取和情感分类任务还是存在一些问题。首先,在方
面词抽取的问题中,方面词的界定存在问题,容易出现方面词中嵌套方面词的问题,这就需
要使用注意力机制来解决。其次,在情感分类的子任务中,往往容易忽略方面词和文本之间
的交互信息,有可能会错误的判断文本具体表达的含义,进而导致情感分类的结果错误。
针对现有的这些问题,本文在已有的工作上进行了相应的改进,具体包含以下的研究内
容:
1、在进行方面级情感分类任务之前,首先需要对评论中的方面词进行抽取。因此,本文
提出基于自注意力机制的情感方面词抽取ABSC模型。模型采用ALBERT进行词嵌入表示,
并利用双向GRU结构进行上下文信息特征提取,接着通过自注意力模块寻找向量层面的最
优序列,最后经过改进型的CRF层,学习相邻标签之间的依赖关系,提取出文本中的方面词。
同时,模型通过消融实验,证明了ALBERT在降低训练时间上的有效性,BiGRU在上下文特
征抽取的有效性。最终,实验表明,本文的算法比同基线模型在相关数据集上提高了3%的F1
值,证明了ABSC模型在方面词抽取任务中的有效性。
2、本文提出一种融合交互注意力的BiIAGRU-BERT情感分类模型,对给定方面词和文
本进行情感极性分类。模型首先利用BERT进行词嵌入,然后通过交互注意力机制计算捕捉
上下文和方面词之间的交互信息,接着分别通过多头自注意力机制来将不同部分的信息整合
起来,最后输出对应的情感极性。在SemEval2014数据集的实验中,相比其他模型有5%的精
确度的提升。
3.基于上文已经提出的模型,借助常见的web开发框架,开发了一个针对电商行业的在
线评论情感分析系统,完成对电商用户评论的不同方面进行端到端方面级情感分类任务,并
详细阐述了系统需求、系统架构,并对相关页面进行测试,验证系统的有效性。
关键词:方面级情感分类,方面词抽取,多头自注意力机制,交互注意力机制
Abstract
Withmodernmobiledevicesand5Gcommunicationenteringthousandsofhouseholds,
traditionalofflineshoppingisgraduallypenetratedbyonlineshopping.Sentimentanalysisofreviews
one-commerceplatformsisbeneficialtomerchantstooptimizetheirproductsandservices,andis
alsobeneficialtobuyerstomakechoices.Differentfromtraditionalcoarse-grainedtextanalysis,
aspect-levelsentimentclassificationaimstoidentifyaspectwordsandcorrespondingdifferent
sentimentsinthetext.Therefore,theresearchofaspect-levelsentimentclassificationmainlyfocuses
onextractingsemanticfeaturesofthetextandestablishingtherelationshipbetweenaspectwordsand
sentiments.Firstofall,intheproblemofaspectwordextraction,thereisaprobleminthedefinition
ofaspect