当下借助量化手段研究固收问题越来越普遍,而我们试图在本专题中构建一个基本的固收量化框架。但固收量化与权益量化仍有明显区别:1、固收量化更聚焦宏观变量和时序分析;2、固收量化的任务主要是择时和捕捉交易信号;3、利率债、信用债、转债等资产各有侧重点。
我们认为,固收量化应以“问题界定→数据处理→特征工程→模型设计→任务评估”五大工程为基本构架,但要避免“学术炫技”、“伪量化”、“过度挖掘”等问题。并且,在固收研究的细节上,还要特别注意强化:1、对宏观环境甚至时代变量的刻画;2、对机构行为的刻画;3、对债券品种相对性价比的刻画。
从“权益量化”到“固收量化”量化研究(Quantitative Research)是通过数学模型、统计分析和计算机等数量工具来探讨或验证市场规律的过程。相比于传统逻辑分析,量化研究更强调对现象的数理刻画、因果推理以及实证。量化研究最广泛的应用就是在股票投资上。传统的股票量化主要有基本面多因子选股、事件驱动选股、高频交易/CTA 等。而固收量化比权益量化至少有三方面不同:一是固收更注重对宏观变量分析,譬如 GDP、PPI 等指标或重要会议、央行行为等事件;二是利率债更侧重择时和捕捉交易信号,择券任务则是少数。三是债券资产大部分时候都是同涨同跌,涨跌幅主要来自久期差异。
量化工程的基本构架:五大工程 量化研究往往起于某个问题,依照工程思维去解决,最后再评估与应用。我们将量化研究的过程总结成五大工程:1、问题或任务的界定。主要考虑问题是否适合量化解决;2、系统化的数据处理,包含数据清洗、数据规范化以及数据平滑,以获得“干净”数据;3、数据特征的扩展,以应对数据量不足情形。可用的方法主要有低频数据转高频、文本数据等,当然也可利用遗传算法等技术衍生数据;4、量化模型的选择,主流仍以多因子以及机器学习为主;5、量化模型评估准则,数据端重点关注是否有未来数据。多因子模型可关注 IC 等指标,机器学习则更依赖测试集以及实践检验。
案例一:神经网络和因果推断在利率择时中的尝试“利率择时”是固收量化研究者相对容易开展的工程。涉及利率择时问题,需要四大类数据:基本面、货币政策与资金面、供求以及情绪指标。择时研究思路主要有两类:
1、利率走势归因。可以利用因果推断模型对 10 年期国债收益率归因。得出的结论是:全部时期下,隐含税率、存款准备金率、通胀(核心 CPI)以及短期资金面因素与 10 年期国债收益率有较强因果性。
2、预测利率值。使用 LSTM 神经网络,预测 10 年期国债收益率走势。预测走势与实际相似,但绝对值差距仍有 20BP 左右,实战效果可能略有不佳。
后续或可通过增加数据、更换模型等方式进一步改进。
案例二:转债“双低策略”的回炉重造“双低策略”是一个经典的转债择券方法,且在过去很长时间都获得了不错的回报特征。但策略缺乏理论支撑、指标未清洗、逻辑过于单一,且未考虑信用资质、流动性等指标。因此我们基于双低策略,改良并构建更优的转债多因子模型。核心是利用中性化、标准化后的股性因子(平价溢价率)和债性因子(YTM)进行择券。改进后策略不仅表现远超传统双低策略,更是在2024 年的转债弱市中获得正回报。当然,因子方向仍有不少可以改进:1、股债性并不是最完美指标,或有指标择券效果更好;2、最大回撤难以控制;
3、信用风险控制并不足;4、条款博弈结合相对较少。
风险提示:历史数据不一定适用于未来;市场环境变化可能使模型失效。
正文目录
前言:从“权益量化”到“固收量化” .......... 4
量化工程的基本构架:五大工程 .......... 6
工程一:问题或任务界定 .......... 6
工程二:系统化数据处理 .......... 7
工程三:数据改造及特征扩展 .......... 10
工程四:模型设计与选择 .......... 12
工程五:任务结果评估 .......... 14
拓展到固收量化:还要对三个关键变量做进一步刻画 .......... 16
要点一:对环境的刻画,尤其是时代背景 .......... 16
要点二:对机构行为的刻画,重在捕捉非基本面的交易信号 .......... 16
要点三:对相对性价比的刻画,考虑债券资产内部轮动方向 .......... 17
案例一:神经网络和因果推断在利率择时中的尝试 .......... 17
案例二:转债“双低策略”的回炉重造 .......... 21
风险提示 .......... 22
图表目录
图表 1: 量化投资发展简史 .......... 4
图表 2: 国内量化公募产品的规模持续增长 .......... 4
图表 3: 国内纯固收量化产品几乎没有,大多融于混合类产品中 .......... 4
图表 4: 股票量化的基本逻辑 .......... 5
图表 5: 固收量化与权益量化的比较 .......... 6
图表 6: 以转债为例的量化工程基本构架 .......... 6
图表 7: 无效值处理案例 .......... 7
图表 8: 极端值、异常值处理案例 .......... 8
图表 9: 利率曲线模拟(正常向上倾斜利率) .......... 8
图表 10: 利率曲线模拟(平坦利率) .......... 8
图表 11: 原始数据→标准化数据 .......... 9
图表 12: 中性化平价溢价率公式 .......... 9
图表 13: 三种常用的标准化处理公式 .......... 9
图表 14: 假设情况下,是否使用未来数据的区别 .......... 10
图表 15: 中性化平价溢价率单因子策略表格、可计算收益、夏普、IC 等指标 .......... 10
图表 16: 中性化平价溢价率改进 .......... 11
图表 17: 低频率数据拓展为高频率数据 .......... 11
图表 18: 利用 AI 处理文本数据,转换为向量 .......... 11
图表 19: 连续数据“离散化” .......... 12
图表 20: 顶底等位置信息 .......... 12
图表 21: 极值中包含未来数据,能精确避开每一波大幅回撤,但意义并不大 .......... 15
图表 22: 万德连板指数(忽视了流动性) .......... 15

因篇幅限制,仅展示部分,更多重要内容、核心观点,请下载报告。