西南证券研究发展中心本文以机器学习算法为基础,在不同红利高股息投资场景下,应用不同类别的机器学习模型赋能红利高股息投资。应用一:利用基于决策树的机器学习模型选取不同风格红利指数;应用二:针对现有红利投资的传统因子,利用强化学习算法深入挖掘不同因子的时序表现,对不同因子进行动态复权。
机器学习应用一:红利主题指数配置本文选取包括中证红利指数在内共计 12 个红利主题指数作为红利指数配置标的,采用 DART增强方式的 LightGBM 算法作为红利主题资产配置模型,构建红利主题指数因子。经回测,红利主题指数因子自 2021 年 1 月至 2024 年 6月 RankIC 为 17.11%,RankIC 胜率为 63.41%,多头组合(Top3)年化收益15.39%,相对等权组合(7.33%)年化超额 8.06%。剔除无跟踪 ETF产品指数后,红利主题指数因子 RankIC 为 18.92%,RankIC 胜率 63.41%,多头组合(Top3)年化收益14.09%,相对等权组合年化超额 6.76%。
机器学习应用二:选股因子动态复权泛高股息指数:定义 “基本+分红”筛选条件,按照月频(每月最后一个交易日收盘)调仓,以股息率加权构建泛高股息指数。截至 2024 年 6 月 30 日,泛高股息股票池中共有 1619只股票。自 2013年 4月 30日至 2024年 6月 30日,泛高股息指数年化收益率 11.05%,整体来看相对跑输中证红利全收益指数,跑赢万得全 A。行业配置方面,泛高股息指数配置比例较高的分别为医药、机械、基础化工、电新行业,占比分别为 9.97%、9.14%、8.94%、6.91%。
泛高股息选股因子探究:本节分别测试了量价、质量、盈利、估值、成长五大类因子共计 30个小类因子,综合考虑 IC及多头组合表现,每大类保留 2个因子。除此之外,本文综合考虑单只股票股息率时序变化以及股息率变化在股票价格上的兑现情况,构建股息兑现因子。上述六大类因子股息兑现、量价、质量、盈利、估值、成长自 2013年 4月至 2024年 6月 IC 分别为 4.94%、7.63%、2.33%、5.19%、1.58%以及 2.42%,等权合成后因子 IC为 7.60%,多头组合年化收益率 17.68%。
强化学习 DQN动态因子复权:本节采取 DQN算法构建相应的因子轮动策略。
以 t-1 期因子表现为当前状态,以 t 期动态复权因子为奖励。在最大化累计奖励的基础上构建 DQN因子(动态复权因子)。经测试,自 2021 年 1月 31日至 2024年 6月 30日,DQN因子 IC 为 9.55%,多头年化收益率 17.58%,相对中证红利全收益指数年化超额收益率 5.93%,多头组合信息比率 0.90,表现均优于等权因子。
风险提示:报告对应的相关结论完全基于公开的历史数据进行算法构建、统计以及计算,文中部分数据有一定滞后性,同时也存在第三方数据提供不准确或者缺失等风险;策略效果结论仅针对于回测区间得出,并不预示其未来表现,也不能保证未来的可持续性,亦不构成投资收益的保证或投资建议。
目 录
1 前言 .......... 1
2 红利高股息投资概览—以中证红利指数(000922)为例 .......... 1
3 机器学习应用一:红利主题指数配置.......... 3
3.1 决策树算法简介 .......... 4
3.2 基于 LightGBM 的红利指数配置策略.......... 8
4 机器学习应用二:选股因子动态复权..........11
4.1 泛高股息股票池构建..........11
4.2 泛高股息选股因子探究 ..........13
4.3 强化学习算法简介 ..........21
4.4 基于 DQN 的泛高股息因子动态复权 ..........23
5 总结 ..........26

因篇幅限制,仅展示部分,更多重要内容、核心观点,请下载报告。