答辩-基于主题模型的用户手机日志数据分析.pptx
文本预览下载声明
基于主题模型的
用户手机日志数据分析;内容简介
主要工作及结果
总结展望;内容简介;主要工作;数据预处理;语料库(Corpus)中共有两篇文档(Documents)
John likes to watch movies. Mary likes movies too.
John also likes to watch football games.
构建单词库(Vocabulary)
得到bag-of-words表示
[1, 2, 1, 1, 2, 0, 0, 0, 1, 1]
[1, 1, 1, 1, 0, 1, 1, 1, 0, 0];手机用户安装的应用列表
手机应用对应的标签列表;获取 Bag-of-labels;用户特征分析;主题模型;主题模型;主题模型;主题模型;LDA;LDA结果;聚类及可视化;K-means聚类;气泡图可视化;简单的推荐系统;简单的推荐系统;推荐系统准确率对比;完成了用主题模型对手机日志数据进行分析的一种方法:
1)用主题模型对用户数据进行分析
2)利用分析结果进行聚类和人群可视化
3)利用分析结果进行应用推荐
未来方向:
1)完善手机应用标签库(可能需人工干预)
2)结合用户其他维度信息,改造LDA的贝叶斯网
3)想出一套标准,可以评价主题模型分析结果的优劣
显示全部