文档详情

基于协同过滤个性化推荐算法的综述.doc

发布:2017-04-07约3.48千字共6页下载文档
文本预览下载声明
基于协同过滤个性化推荐算法的综述   摘 要:互联网的发展是呈爆炸式的,无论是用户数量还是信息数量。现在的时代是大数据时代,这个时代的问题已经不是苦于没有数据,没有信息的时代。而是在这么多的数据中找到有用的数据,挖掘潜在的信息的时代。个性化推荐,本质上来说,是为了解决信息的超载问题。当一个用户搜索一个产品或者一条信息,如何在茫茫信息海中提供给用户的商品恰是用户感兴趣的,可以帮助用户减少不必要的时间去筛选用户不感兴趣的东西。本文主要介绍在众多推荐算法中最常见的协同过滤的研究现状,推荐算法,优缺点等问题。通过简单的例子让大家明白协同过滤的主要思想。   关键词:协同过滤;基于用户;基于物品;相似程度   一、协同过滤推荐的研究现状   首先了解一下推荐系统,比较普遍认可的定义是Resnick和Varian在1997年[1]提出的:“它是利用电子商务网站向客户提供商品信息和建议,帮助用户决定购买什么产品,模拟销售人员帮助客户完成购买过程。”而协同过滤是推荐系统中最常见也是最广泛应用的推荐方法。Grundy书籍推荐系统[2]是公认的第一个对协同过滤应用的系统。还有Tapes-try邮件处理系统[3],Ringo[4]等。Sarwar等[5]提出的利用夹角余弦来计算产品的相似程度。Chen和Cheng[5]通过观察不同产品在用户的列表次序来计算用户与用户的相似程度.而Yang和Gu[7]利用建立用户的兴趣点来计算用户与用户间的相似程度。   二、协同过滤推荐的主要思想   协同过滤推荐的思路可以说是来源于生活。通过在生活中购买产品你会发现一些有趣的现象。比如说,人们总是更倾向于相信来自熟人的推荐,在你的朋友圈内,很多朋友都在使用同一种产品,那么你就也会很大程度有意的选择此产品。另外就是,在你对某种产品感兴趣时,当你发现有和你感兴趣的这种产品类似的产品,与此同时,其他购买者对这种产品的体验良好,那么你也很可能会购买这种商品。协同过滤的主要思想可以分成两个部分:一是通过分析用户以往的购买或者选择信息,来计算用户之间的相似程度,通过相似程度高的用户可以说是近邻对一个产品或信息的偏好来预测目标用户的对此产品或信息的偏好程度。二是通过分析对用户以往对某类产品的评价情况来预测该用户对此类中新产品的偏好程度,及计算以往评价过的产品与要推荐产品间的相似度。   协同过滤推荐主要有两种,一个是基于User的,另一个是基于iterm的。   1、基于用户的方法主要是寻找与目标用户相似的用户,认为有相似偏好的用户可能对某个产品或信息有相似的评价。通过利用相似近邻的偏好程度来进行对目标用户的评价的预测。比如说有三部电影《饥饿游戏》《千与千寻》《分手大师》。A下载了《饥饿游戏》,播完了《千与千寻》,没播完《分手大师》。B多次观看《饥饿游戏》,播完《千与千寻》,没看《分手大师》。C下载了《分手大师》,没看《饥饿游戏》,没播完《千与千寻》。那么可以看出来A与B很相似,那么再出现一个电影《变形金刚》,A是多次观看,那么应该把变形金刚推荐给B而不是C。关于这个用户之间相似程度的计算,可以通过对电影的评分机制进行量化,然后利用夹角余弦来计算用户之间的相似程度。设用户i和用户j在n维对象的空间上的评分向量为i,j,那么计算cos(i,j)的公式为:   cos(i,j)=i?j|i|*|j|   若两个用户的夹角余弦值相近,则可认为他们是相似用户。   关于相似程度的计算还可以通过皮尔森相关系数和修正余弦函数相似性等很多方法。   2、基于物品的方法主要首先是计算物品与物品之间的相似程度,然后结合用户以前的购买评价过的物品或选择行为,最后对用户进行某种新物品的推荐。比如说A喜欢看《分歧者》,《复仇者联盟》,《超体》。然后有两部电影《何以笙箫默》和《敢死队》。可以很明显的看出可以向A推荐《敢死队》。基于物品的系统过滤在计算物品的相似度时,也是可以通过评分量化,很多时候也是可以加入tag技术,对物品打标签,做标签矩阵。比如A喜欢的电影中《分歧者》是有动作,爱情,科幻三个标签,每个标签的权重不一样可以按0到1之间的分值设定。然后同理其他电影,最后通过量化计算相似度发现《敢死队》更符合推荐。关于tag矩阵也可以是0-1矩阵。关于计算相似程度与(1)中提到过的方法类似。   三、协同过滤推荐的优缺点   协同过滤的优点有:   1、可以进行过滤复杂性的,机器难以进行提取有效自由文本的信息,如音乐,图像等艺术类信息。   2、相对容易给用户制造惊喜。与基于内容的推荐不同,推荐给用户的物品内容可能是用户不太熟悉的内容,很可能发现用户潜在的喜好但用户本身却没有意识到的。   3、用户的不断增加,协同过滤推荐系统的性能也会增高。   协同过滤的缺点:  
显示全部
相似文档