基于在线弹幕及评论的手机用户需求研究.pdf
摘要
摘要
随着互联网的飞速发展,新的知识媒介不断涌现,数字化充斥着人们的日
常生活。用户随时随地可以通过观看视频、音频、直播等获取所需信息,并
且用户也乐意通过弹幕及评论的形式对所得信息进行反馈。因此弹幕及评论
等非结构化数据大量出现。弹幕数据以短文本为主,强用户交互性、实时性
的特点促进了用户之间的沟通交流。而评论更多是中长文本,总括性地表达
用户看法。这两种文本不但代表了用户的看法也为服务提供者带来了更多探
究用户想法以及了解用户需求的机会。然而短文本因其评价对象的多元化及
语法结构不完整的性质,使得其主题模型分析存在一定复杂性。并且当前研
究很少将弹幕与评论结合进行全面分析。基于以上背景,本文爬取哔哩哔哩
弹幕网(b站)数码区手机测评视频的弹幕及评论,运用主题建模与细粒度情
感分析,结合kano模型的管理学理论构建模型,实现对文本数据信息的全面
提取,对用户需求进行研究。
首先,本文将手机按照低、中、高端依次划分为高性价比手机、中端手机、
b
高端手机、折叠手机四类,运用网络爬虫技术对站数码区中各类手机测评
视频所包含的弹幕及评论进行爬取,共计爬取弹幕29万余条,评论17万余
条,并对获取的数据进行数据预处理。
其次,由于弹幕文本具有结构稀疏的特性,LDA主题模型不适合处理短
文本,本文提出UIE-bertopic框架进行主题建模,即先对弹幕进行信息抽取去
掉没有实体的多余弹幕,并据此运用bertopic主题聚类模型进一步提取弹幕主
题。而对于评论,本文使用被广泛应用的LDA主题模型进行主题提取。然后
提出了一种主题融合方法将弹幕与评论两个视角的数据主题进行合并。
最后,本文基于主题提取结果设置方面词,进行细粒度情感分析,得出用
1
基于在线弹幕及评论的手机用户需求研究
户关注度及满意度,结合kano模型理论分别探索了高性价比手机、中端手机、
高端手机、折叠手机用户对于手机性能的不同需求侧重点。研究发现对于高
性价比手机厂商应当保持外观、处理器、续航这三类属性的优秀性能,并根
据成本预算选择性地提升屏幕、价格、系统属性,售后服务属于吸引用户的
差异化亮点。对于中端手机厂商应优先依次提升处理器、屏幕、续航、性价
比,并将外观设计和质感做成自身亮点。对于高端手机厂商应当维持系统、
处理器、产品体验,依次提升屏幕、续航属性,将品牌管理与产品外观设计
打造出亮点。对于折叠屏手机厂商应保持外观和产品体验属性,进一步提升
屏幕性能,形成差异化的品牌管理、售后服务以及系统属性。
关键词:主题模型;细粒度情感分析;kano模型;用户需求;文本数据
2
Abstract
Abstract
WiththerapiddevelopmentoftheInternet,newmediumsareemergingand
digitalizationisfloodingpeoplesdailylives.Userscangettheinformationthey
needanytimeandanywherebywatchingvideos,audio,livebroadcasts,etc.Atthe
sametime,usersarehappytogivefeedbackontheinformationtheygetinthe
formofdanmuandcomments.Thisresultsinunstructureddatasuchasdanmuand
comments.Danmuareshorttextswithuserinteractivityandreal-timefeat