基于顾客评论的细粒度情感分析研究.pdf
摘要
摘要
随着行业竞争格局日益白热化,商户管理难度增强,宽幅加大,经营要求更
精细,同时顾客对服务质量和产品品质追求提高,分析讨论海量顾客评论,挖掘
其中蕴含的应用价值具有重要意义。通过分析评论,能够描述消费感受,反映商
家服务质量的高低,因此从评论文本中抽取价值信息对商家和消费者都有益处。
传统情感分析侧重于篇章级和句子级的粗粒度情感研究,对文本进行整体分
析,获得整体的情感极性,若文本中出现多方面的评价且对应情感极性不一致时,
AspectBasedSentiment
其效果往往不能满足用户的个性化需求。细粒度情感分析(
Analysis,ABSA)旨在抽取用户对于商品的某方面的情感偏向,能够为用户提供更
加精准的信息。针对细粒度情感分析问题,围绕方面实体的情感分析(AspectTerm
SentimentAnalysis,ATSAAspectCategorySentiment
)和方面类别的情感分析(
Analysis,ACSA),研究设计有效的深度学习算法模型。论文的主要工作如下:
1.针对方面实体情感分析,本文提出了基于轻量型文本表征ALBERT的
BiLSTM-GateCNN的混合网络模型。采用ALBERT预训练模型做文本表征,增加
Adapter模块,利用轻量化的优势极大减少了向量表示的训练时间和学习参数量。
在文本特征提取过程中,将BiLSTM网络与门控卷积网络结合,使模型同时关注
局部特征和上下文相关信息,增强模型语境学习能力。通过和当下的主流模型进
行对比实验,表明了模型在评价指标上有较大的提升。
2.针对方面类别情感分析,拆分成方面词识别、观点抽取、方面类别和情感极
性分类三个子任务。对于方面词识别,已有的主流模型存在结构复杂、学习速度
慢问题,本文设计了基于ALBERT的BiGRU-CRF的方面词识别算法,通过减少
模型复杂度改善训练时长,同时保证模型的精确度。对于观点抽取,融合问答机
制,设计围绕方面词知识的query,提出了RoBERTa-QA的文本表征训练方法,增
强模型捕获观点信息的能力。对于方面类别和情感极性分类,设计了基于RoBERTa
和多头注意力机制改进的多任务多分类模型。通过在公开数据集上开展对比实验,
结果验证了模型在情感分类任务上具有较好的效果。
3.开发了基于顾客评论的细粒度情感分析系统,利用本文提出的细粒度情感分
析模型处理实际问题,结果可视化直观的展示给用户,进一步验证本文提出模型
的针对性和有用性。
关键词:细粒度情感分析,方面实体情感分析,方面类别情感分析,注意力机制
I
ABSTRACT
ABSTRACT
Theindustrycompetitionpatternisshowingawhite-hottrend,somerchant
managementbecomesmoredifficult,widerandmorerefined.Atthesametime,
customersarepursuingmoreperfectservicequalityandproductqualityintheindustry.
Analyzinganddiscussingthemassivecustomerreviewsandtaptheapplicationvalue
containedinthemismeaningful.Byanalyzingcustomerreviews,itispossibleto
describeconsumptionfeelingsandreflectthequalityofmerchantsservices.Therefore,
extractingvaluein