基于图神经网络融合特征信息的协同过滤方法研究.pdf
摘要
在推荐系统中,基于协同过滤的方法,因其能够通过汇集大量用户的喜好和
偏好信息,准确地预测用户的兴趣,因此成为最受欢迎和广泛采用的推荐技术之
一。近些年随着深度学习在推荐系统领域的应用,预测的精度也有了飞速的提升,
但是还是存在着难以解决的问题:在基于深度学习的协同过滤方法中特征交互对
于提高推荐精度有着不可替代的作用,用户特征和项目特征对推荐系统来说是重
要的信息,它们之间的交互,显著的提高了推荐的准确率。现有的模型把交互的
类型分为内部交互和交叉交互,但是它没考虑交叉交互中信息的不同重要性。同
时,它也没有捕获具有高阶交互的特征之间更复杂的依赖关系。随着用户数量以
及项目数量的增加,数据变得更加的稀疏,协同过滤算法无法避免这个问题。当
用户和项目的交互信息不足时就会出现冷启动的问题,现有方法依赖于固定的用
户项潜在值表示,这限制了模型正确识别实际的潜在向量的能力,会导致预测的
误差。针对上述问题,本文的主要研究内容包括:
(1)本文提出了基于自注意力机制和特征融合的协同过滤模型
(CollaborativeFilteringbasedonSelf-AttentionMechanismandFeatureFusion,
CF-SAFF),显式地使用内部交互进行用户和物品特征学习,并使用自注意力机
制为交叉交互信息分配不同的权重,表示交互节点信息的不同重要性,从而对推
荐进行偏好匹配。同时,利用内部交互信息和交叉交互信息的融合操作来发现高
阶特征组合信息,提高了模型的预测精度和泛化能力。该模型使用MovieLens1M,
Book-Crossing和Taobao数据集进行了对比试验,结果表明该模型在所有性能指
标上都取得了较好的结果。
(2)本文在CF-SAFF的基础上,提出结合元数据的改进型推荐算法,名为
融合元数据信息的协同过滤模型(FusionofMetadataInformationCollaborative
Filtering,FMICF)。使用用户人口统计数据和项目类型作为元数据信息,将元
数据信息模块(Meta)的输出和CF-SAFF的输出进行信息融合并输入到神经网
络进行评级预测,元数据信息能够更好地学习用户-项目交互,从而缓解冷启动
问题。为了证明所提出模型的有效性,使用两个评价指标,均方根误差(RMSE)
和平均绝对误差(MAE)。模型在MovieLens和AmazonMovies上进行了实验,
融合元数据(Meta)的模型使得RMSE指标降低了12.880%,MAE指标降低了
16.103%,实验结果显示出元数据信息模块的重要性。
关键词:协同过滤算法,自注意力机制,高阶交互,元数据信息,信息融合,图
神经网络
Abstract
Inrecommendationsystems,methodsbasedoncollaborativefilteringhave
becomeoneofthemostpopularandwidelyadoptedrecommendationtechnologies
becauseoftheirabilitytoaccuratelypredictusersinterestsbygatheringalarge
numberofuserspreferencesandpreferences.Inrecentyears,withtheapplicationof
deeplearninginthefieldofrecommendationsystems,theaccuracyofpredictionhas
alsoimprovedrapidly,buttherearestillproblemsthataredifficulttosolve:inthe
collaborativefilteringmethod,featureinteractionplaysanirreplaceablerolein
improvingrecommendationac