文档详情

答辩-基于移动端游戏数据的人群特征可视化研究.ppt

发布:2018-07-03约1.51千字共20页下载文档
文本预览下载声明
只为设计最优质PPT 关注 灰色的风 更多优秀PPT作品 / 模板 / 图表 / 教程 / 经验分享 / 优秀设计 公众号 hsdf_ppt 微博 @灰色_风 本套模板中使用了“方正正中黑_GBK、Impact”字体,请在计算机中安装以上字体,以确保字体显示正确。 * ZJU 本科毕业论文答辩 基于移动端游戏数据的人群特征可视化研究 CONTENTS 目 录 1 研究背景及论文摘要 3 建立主题模型 5 可视化展示 2 研究方案 4 人群聚类 6 结果分析 ONE 1 研究背景及论文摘要 1 2 手机游戏应用市场火爆 智能手机,4G网络的普及和快速发展。 手机游戏行业兴起。 用户数量多,人群广。 用户信息太少 只统计一些下载量,月流水量,留存率等数据。 没有对用户深入了解,难以优化产品。 研究背景 移动端游戏数据 人群特征可视化 论文摘要 本文将对采集到的手机游戏数据做处理,建立主题模型,研究在游戏数据中能够映射出的用户特征,并且将用户按人群聚类,进行可视化展示,分析结果。 游戏,用户特征,聚类,可视化 TWO 2 研究方案 数据处理 建立模型 人群特征 可视化 研究方案 (LDA主题模型) (Treemap) 游戏分类标签信息 处理后数据字段 游戏名字纷繁复杂,对 每个游戏贴上标签进行 降维,规范化,方便统计。 游戏不再以游戏名称而是 以标签名称及数量统计, 按以下字段存入数据库。 数据处理 THREE 3 建立主题模型 建立模型 LDA主题模型是文档分析中常用的模型,在LDA模型中,一段文档被当做一个不考虑前后顺序的词袋,通过分析词袋,LDA模型可以提取出文档中潜在的主题信息。 定义手机游戏所包含的多个分类标签对应的单词,一部手机则对应一篇文档,采集到的手机用户即为语料库,通过提取出的主题来分析手机用户特征。 LDA主题模型 应用到手机 1 2 将千差万别的手机游戏名称,提取为该手机用户与几个主题的相关度,而几个主题按照不同比例组合,就可以代表一个手机用户的特征,还可以将特征类似的用户聚成一个人群。 结果 3 LDA主题模型 P(标签|手机)=P(标签|主题)×P(主题|手机) θ φ “文档—主题”分布 语料库中的每一篇文档与T个主题的一个多项分布相对应,将该文档—主题分布记为变量θ。 “主题—标签”分布 每个主题与单词表中V个单词的一个多项分布相对应,将该主题—单词分布记为变量φ。 计算LDA主题模型 手机在主题上的分布θ 主题在标签上的分布φ FOUR 4 人群聚类 通过上面LDA模型的学习,我们同时得到了每个手机用户与5个主题分别的相关度大小,此时用5个主题的相关度就可以代表该手机用户的特征,如某个手机用户和“休闲益智”,“武侠修仙”,“经营养成”,“文字棋牌”,“怀旧经典”5个主题的相关度大小分别为0.8,0.3,0.1,0.3,0,那么该用户则属于偏爱休闲益智类游戏的用户。将用户以这样的五维向量表示后,便可以使用K-means算法来进行聚类。 休闲益智 武侠修仙 经营养成 人群聚类 我们将前面得到的人群和主题的关系,主题和具体分类标签的关系,结合在一起,形成嵌套结构,将数据结果以json数据格式保留,便于可视化展示。 人群聚类 FIVE 5 可视化展示 只为设计最优质PPT 关注 灰色的风 更多优秀PPT作品 / 模板 / 图表 / 教程 / 经验分享 / 优秀设计 公众号 hsdf_ppt 微博 @灰色_风 本套模板中使用了“方正正中黑_GBK、Impact”字体,请在计算机中安装以上字体,以确保字体显示正确。 *
显示全部
相似文档