股票舆情热度的反转效应与“热点反应”因子构建.docx
正文目录
前言 4
新闻舆情热度alpha来源 5
“凸显效应”因子样本外表现 6
“热点漂移”因子 8
热度异常变化蕴含的交易信息与“热点反转”因子 13
“热点反应”因子 17
3总结 19
图表目录
图表1:每月股票热度排名(2022-2025.2) 5
图表2:每月股票冷门度排名(2022-2025.2) 6
图表3:“凸显效应”因子十分组年化超额收益率(周频) 7
图表4:“凸显效应”因子IC统计(周频) 7
图表5:“凸显效应”因子十分组超额净值(2022-2025.2.28,周频) 7
图表6:“凸显效应”因子全时间段IC表现(2022-2025.2.28,周频) 7
图表7:“热点漂移”因子十分组年化超额收益率(周频) 8
图表8:“热点漂移”因子IC统计(周频) 8
图表9:“热点漂移”因子累积净值(周频,2022-2025.2) 8
图表10:“热点漂移”因子全时间段IC表现(2022-2025.2.28,周频) 9
图表11:“热点漂移”因子十分组超额净值(2022-2025.2.28,周频) 9
图表12:“热点漂移”因子与风格因子相关性 10
图表13:“热点漂移”因子不同行业IC表现(2022-2025.2.28,周频) 10
图表14:“热点漂移”不同宽基指数IC表现(2022-2025.2.28,周频) 11
图表15:纯“热点漂移”因子十分组年化超额收益(周频) 11
图表16:纯“热点漂移”因子IC统计(周频) 11
图表17:纯“热点漂移”因子十分组超额净值(2022-2025.2.28,周频) 11
图表18:纯“热点漂移”因子全时间段IC表现(2022-2025.2.28,周频) 12
图表19:热度变化与热度分组收益表现(2022-2025.2.28,周频) 12
图表20:热度变化与热度分组收益表现(2024.9-2025.2.28,周频) 12
图表21:股票热度异常变化 13
图表22:不同参数下每个股票每周触发异常次数 13
图表23:热度下降、股价上涨时刻动量因子(月频) 14
图表24:热度下降、股价下跌时刻动量因子(月频) 14
图表25:热度上升、股价上涨时刻动量因子(月频) 14
图表26:热度上升、股价下跌时刻动量因子(月频) 14
图表27:不同热度场景下动量因子表现(2022-2024.12.13,月频) 15
图表28:“热点反转”因子十分组年化超额收益(周频) 15
图表29:“热点反转”因子IC统计(周频) 15
图表30:“热点反转”因子全时间段IC表现(2022-2024.12.13,周频) 15
图表31:“热点反转”因子在不同宽基指数IC表现(2022-2024.12.13,周频) 16
图表32:“热点反转”因子与风格因子相关性 16
图表33:“热点反转”因子十分组超额净值(2022-2024.12.13,周频) 16
图表34:“热点反应”因子十分组年化超额收益(周频) 17
图表35:“热点反应”因子IC统计(周频) 17
图表36:“热点反应”因子全时间段IC表现(2022-2024.12.13,周频) 17
图表37:“热点反应”因子与风格因子相关性 17
图表38:“热点反应”因子十分组超额净值(2022-2024.12.13,周频) 18
图表39:“热点反应”不同行业IC表现(2022-2024.12.13,周频) 18
前言
长久以来,如何从新闻数据和热度数据中提取有效信息,甚至可以借助日益强大且推理成本不断下降的大模型来构建量化策略,成为量化从业者关注的焦点。尽管市场对新闻舆情的关注度日益提高,但如何系统性地量化市场注意力效应并将其转化为可交易信号仍然存在诸多挑战。
在我们此前的研究《新闻中的有限注意力和凸显效应因子构建》中,团队尝试利用大模型对每天数以万计的新闻文本进行逐条打分,期望从中挖掘出有效的投资信号。然而,最终策略效果未达预期,我们总结出以下几个关键原因:新闻数据的信噪比较低——大量噪音信息充斥其中,使得真正有价值的信息往往被淹没,难以稳定提取可交易信号;多头端的有效信息是否会以新闻形式出现?——即便某些关键信息能够通过新闻传播,市场可能会快速定价,使得这些信息难以转化为可持续的交易策略。尤其是在非事件驱动策略中,单从新闻文本难以判断市场是否已经消化相关信息。于是我们在之前研究中借助同花顺的高频股票热度数据,构建相关策略。这样的构建方式能够帮助我们避免处理繁琐复杂的新