国债期货跨期价差系列专题五:基于LSTM的时序预测与策略改进研究
广发期货·2025-12-31 16:35

报告行业投资评级 未提及 报告的核心观点 - 引入LSTM时序模型改进国债期货跨期价差预测问题,考察时间依赖信息对预测及策略表现的边际贡献 [38] - 部分品种引入时序建模可改善收益稳定性与风险控制,但不同合约对时序信息敏感程度有差异 [38] - LSTM模型在T与TF合约上样本外表现优于DNN,TS合约上DNN预测能力强,TL合约两类模型表现有限 [39] - 概率加权方案在T、TF与TS合约多数情况下可提升策略收益风险特征,TL合约效果不明显 [39] - 跨期价差预测与交易中,引入时序模型结合连续概率信号仓位管理有应用潜力,但效果依赖品种特性等因素 [40] 根据相关目录分别进行总结 跨期价差影响因素与指标选取 - 传统机器学习模型与DNN建模假设样本时间维度独立,核心是对“当前状态”的静态映射,引入时间信息依赖特征工程设计,且无法区分不同历史路径差异,表达能力受限 [7] - LSTM引入记忆单元传递信息,解耦“长期信息存储”与“当前状态输出”,通过门控结构控制信息流,能兼顾短期波动与中长期演化特征 [7][8][10] - 国债期货跨期价差部分阶段有持续性与方向性特征,引入LSTM等时序模型可增强对跨期价差时序结构的刻画能力 [12] 循环神经网络测试流程 数据处理与样本构造流程 - 数据获取使用国债期货T、TF、TS、TL四类合约基本面因子 [16] - 特征构造引入资金面指标、构造派生利差变量,标签以跨期价差一阶差分划分样本类别,二分类仅保留涨跌样本 [17] - 特征预处理剔除上市初期样本、去除季月末交易日、过滤极小价差变动,填充缺失值并标准化 [18] - 以5个交易日为历史窗口构造时序样本,过滤末端标签为中性的样本 [19] - 按时间切分样本,2024年及以前为训练候选样本,2025年为样本外测试集,训练候选样本7:3划分为训练集与交叉验证集 [20] - 模型训练采用加权交叉熵损失函数和Adam优化器,基于验证集损失设置学习率衰减与早停机制 [22] - 用2025年数据进行样本外测试,通过准确率等评估方向预测能力,保留概率分布结果用于仓位回测 [23] 参数设定与LSTM网络结构 - 任务为二分类预测,输入连续5日因子序列,输出二分类logits [24] - LSTM层3层,隐藏状态维度8,Dropout比例0.3,仅用最后时间步隐藏状态表示序列,分类层用Dropout + Linear映射至2维分类空间 [25] - 损失函数为加权交叉熵,基于训练集样本比例自动计算类别权重以缓解样本分布不均衡问题 [26] - 优化器为Adam,初始学习率0.001并进行学习率衰减 [27] 模型测试结果 LSTM模型与DNN模型样本外测试对比 - T与TF合约上,LSTM模型概率加权回测累积收益和夏普比率更高,最大回撤更低;TS合约上DNN表现更优;TL合约两类模型表现有限 [28] - 不同合约对时序信息敏感程度不同,LSTM未在所有品种形成全面优势 [30] LSTM模型概率加权回测 - 用模型输出预测概率刻画信号强弱,以概率减0.5为仓位信号,对仓位归一化并设置最大仓位限制 [33] - 概率加权机制在多数合约上改善样本外绩效,提升收益与夏普比率,未显著放大回撤水平;TL合约表现提升有限 [35] 结论 - 引入LSTM时序模型改进跨期价差预测,部分品种引入时序建模有改善,但不同合约对时序信息敏感程度不同 [38] - LSTM在T与TF合约表现优,TS合约DNN强,TL合约两类模型表现有限;概率加权在T、TF、TS合约多数情况提升策略收益风险特征,TL合约效果不明显 [39] - 跨期价差预测与交易中引入时序模型结合概率信号仓位管理有应用潜力,效果依赖品种特性等因素 [40]