基于知识图谱的推荐系统公平性研究.pdf
摘要
摘要
基于知识图谱的推荐系统从诞生之初就引起了学术界以及工业界研究人员极
大的兴趣,这类推荐系统不仅可以很好的解决冷启动问题,还能为企业业务的增
长提供可靠的解决方案,我们的社会生活与之密不可分。研究人员在设计和使用
这些系统时,需要考虑公平性问题,避免这些系统对某些个人或群体产生歧视,甚
至加深已有的歧视。然而本文发现即使没有显式的将受保护的敏感属性信息引入
到知识图谱中,推荐系统仍然可以捕捉到这些敏感属性信息,从而产生不公平的
推荐结果。
现有的大多数去偏方法需要复杂的模型设计或者只能应用于特定的模型,并
且只能处理单个敏感属性的公平约束,难以用于多敏感属性的去偏场景。而部分
能够进行多敏感属性公平约束的方法只是简单地将单个敏感的过滤器线性组合起
来,以完成多敏感属性去偏工作,忽略了敏感属性之间的潜在关联,不能保证所
有多敏感属性群体都满足公平约束。除此之外,还有一些方法对输入数据的公平
性有特殊要求,难以应用于现实生活中的推荐场景。
为了解决上述问题,本文提出了适用于任意基于知识图谱的推荐系统的公平
表征学习模型。本文通过引入敏感图来学习敏感属性之间的潜在关系,以灵活适
应多敏感属性的公平约束场景。具体来说,给定一个基于知识图谱的推荐模型,首
先以受保护的敏感属性作为节点,动态学习敏感属性节点之间的隐藏关系,以此
构建敏感图;然后将敏感图的表征与原始的知识图谱的表征融合起来,在不改变
原始推荐算法的情况下,引入对抗学习框架来去除利用敏感图以及原始知识图谱
生成的用户表征中的敏感属性信息;最后,本文在两个公开真实的推荐数据集上
进行了大量的实验,结果表明本文所提出模型可以提升任意基于知识图谱的推荐
系统的公平性表现,而且几乎不损失系统的推荐性能。
关键词:推荐系统,知识图谱,公平性,公平表征学习,算法去偏
I
ABSTRACT
ABSTRACT
Knowledge-awarerecommendationsystemhasattractedconsiderableinterestinaca-
demiaandindustry,whichcomesinhandytosolvethecold-startproblemandofferareli-
ablesolutionforthebusinesstogrow.Thiskindofrecommendationsystemcannotonly
solvetheproblemofcoldstartwellbutalsoprovidereliableinformationforthegrowth
ofenterprisebusiness.Solutions,oursociallifeisinseparablefromit.Therefore,when
designingandusingthesesystems,weneedtoconsidertheissueoffairness,toavoid
thesesystemsfromdiscriminatingagainstcertainindividualsorgroups,orevendeepen-
ingexistingdiscrimination.However,wefoundthatevenwithoutexplicitlyintroducing
theprotectedsensitiveattributeinformationintotheknowledgegraph,therecommender
systemcanstillcapturethesesensitiveattributeinformation,resultinginunfairrecom-
mendationresults.
Mostoftheexistingdebiasingmethodsrequirecomplexmodeldesignorcanonly