文档详情

新浪微博话题热度预测算法研究.doc

发布:2025-02-15约3.54万字共48页下载文档
文本预览下载声明

目录

摘要

新浪微博话题热度预测算法研究

摘要

文章提出通过对比一个新话题的近期评论转发数时间序列数量曲线和收集到的大量历史流行与非流行话题评论转发数时间序列数量曲线来对话题热度发展趋势进行预测的方法。

首先,提出来通过数据来确定话题的发展趋势而非存在许多不确定因素的内容的想法。根据潜在源原理,假设存在一系列对应于一个特定类型的典型事件的潜在源时间序列,然后该潜在源产生已经存在的参考对象时间序列数量曲线和正在产生的观测对象时间序列数量曲线,通过计算观测对象到参考对象之间的距离来计算该观测对象与这一类的相似概率。如果概率大于某一阈值则认为该话题会变热,成为热点话题,反之判断该话题不会变热。

显示全部
相似文档