文档详情

《基于协同过滤的个性化推荐系统研究》开题报告课件.ppt

发布:2017-11-22约6.41千字共30页下载文档
文本预览下载声明
题目:基于协同过滤的个性化推荐系统研究 姓 名:× × × 学 号: × × × 专 业:计算机软件与理论 指导教师: × × 20 ×年×月× 日 提 纲 一、题目名称 二、论文选题的目的和意义 三、研究工作的主要内容和重点 四、研究方案 、技术路线及措施 ,所需的技术条件及试验条件,存在的主要问题和关键技术 五、预期达到的目标 六、研究计划及进度 七、参考文献 二、论文选题的目的和意义 1.选题的目的和意义 2.国内外研究现状 2.1 选题目的和意义 (1)解决“信息过载”问题 (2)发掘物品的“长尾” (3)提高用户体验和网站的服务质量 2.2 国内外研究现状 2.2.1 国外研究现状 (1)ACM设立推荐系统年会 (2)亚马逊推荐系统 (3)Netflix Prize推荐系统比赛 2.2.2 国内研究现状 (1)2000年左右引起国内关注 (2)当当网、淘宝、百度推荐系统 (3)“天猫”推荐算法大赛 三、研究工作的主要内容和重点 1.个性化推荐系统 2.协同过滤推荐算法的研究 3.推荐系统评测指标 3.1 个性化推荐系统 3.1.1 推荐系统通用模型 3.1 个性化推荐系统 3.1.2 推荐系统形式化定义 C是所有用户(User)的集合,S是所有可以推荐给用户的对象(Item)集合,u(c,s)是效用函数。 3.2 协同过滤推荐算法的研究 流程概括: 1.收集每个用户行为数据 2.计算用户或者物品相似度 3.利用相似的用户或者物品产生推荐 3.2 协同过滤推荐算法的研究 3.2.1 评分矩阵 U是所有用户的集合,I是所有项目的集合,该矩阵中每一个“用户-项目”元素即为评分值,表示当前用户对当前项目的喜好程度。 3.2 协同过滤推荐算法的研究 3.2.2 相似度 (1)欧几里德距离 x,y是n维空间的两个点,d(x,y)表示两个点之间的距离。 3.2.2 相似度 (2)皮尔逊相关系数 代表用户a的平均评分 , 代表用户a对推荐对象p的评分, 为用户a和用户b共同评分对象集合。 3.2.2 相似度 (3)修正的余弦函数 为用户a和用户b共同评分对象集合, 代表用户a对推荐对象p的评分, 为用户a评价过的对象集合, 为用户b评价过的对象集合。 3.2 协同过滤推荐算法的研究 3.2.3 最近邻计算 A所示的是固定数量的邻居(K-neighborhoods),只取最近的K个项目作为其邻居。 B所示的是基于相似度阈值的邻居(Threshold-based neighborhoods),将距离控制在以K为半径的区域中来选取邻居。 3.2 协同过滤推荐算法的研究 3.2.4 预测评分 用户a的最近邻集合为N,sim(a,b)为用户a和用户b的相似度。 和 是用户a和b对推荐对象的平均分, 表示用户b对推荐对象p的评分。 3.3 推荐系统评测指标 (1)MAE(平均绝对误差) 是用户u对物品p的实际评分, 是推荐算法给出的预测评分, 为用户进行打分物品的个数。 3.3 推荐系统评测指标 (2)RMSE(均方根误差) 是用户u对物品p的实际评分, 是推荐算法给出的预测评分, 为用户进行打分物品的个数。 3.3 推荐系统评测指标 (3)查准率 是推荐算法为用户u产生的推荐列表, 是用户u喜好的产品列表。 3.3 推荐系统评测指标 (4)查全率 是推荐算法为用户u产生的推荐列表, 是用户u喜好的产品列表。 四、研究方案、技术路线及措施,所需的技术条件及试验条件,存在的主要问题和关键技术 1.拟采取的研究方案 2.技术路线及措施 3.所需技术及试验条件 4.主要问题和关键技术 4.1 拟采取的研究方案 1.基于Mahout开源平台构建传统的协同过滤推荐系统,并对其进行研究。 2.分析传统协同过滤推荐系统中的不足,提出改进措施,并基于Python平台将改进后的算法编程实现。 3.采用网络公开数据集或某零售商品牌专有销售记录进行实验,并将其改进后算法的实验结果与传统算法的实验结果进行对比,根据对比分析得出结论并采用迭代的方式不断优化。 4.2 技术路线及措施 (1).学习推荐系统的相关概念知识,主要是个性化推荐算法中的协同过滤推荐技术的原理与实现,常用的算法以及应用情况。 (2).了解目前在个性化推荐算法领域常用的数据集。 (3).掌握推荐算法的评测指标。 (4).使用Taste推荐引擎算法集,对传统协同过滤算法进行测试,并给出评
显示全部
相似文档