多模型融合
搜索文档
基于多因子体系的基差预测模型(二):股指基差何去何从
华泰期货· 2026-03-09 17:02
报告行业投资评级 未提及 报告核心观点 - 同品种不同合约基差的有效因子有显著区别,印证各合约交易群体、交易偏好不同 [4] - 不同时间段下的有效因子、相同因子的相关性均有差异,表明不同市场环境下影响基差的因素不同 [4] - 截面因子模型与时间序列模型相结合对预测效果有一定提升 [4] 根据相关目录分别进行总结 基差预测模型的延申与优化 - 在前序报告基础上,对预测各环节拓展完善,包括加入新因子并调整入选标准、固定因子改滚动筛选因子、单合约拓展至全合约预测、加入时间序列模型构建多模型融合预测体系 [10] 因子增添与筛选 - 从资金行为角度探究两类因子与基差相关性,一类用不同ETF份额和市值代表市场风格,一类用华泰CFTI席位分类数据代表不同客户群体 [11] - 大部分ETF份额、市值与基差有显著相关性,进取型ETF与基差负相关,稳健型ETF与基差正相关 [12][14] - 部分CFTI类因子与基差有显著相关性,零售净持仓与基差正相关,机构净持仓与基差负相关 [16] - 增添期货收益率、波动率等因子,构建因子相关性矩阵,筛选高度相关因子对,保留与基差相关程度更高的因子提升模型稳健性 [17] 滚动筛选因子 - 将原有静态固定因子选取方式调整为滚动窗口动态因子筛选,提升模型在不同市场环境下的适应性 [18][19] - 滚动测试中某些因子相关性变化大,不同时间段有效因子不同,反映市场对冲工具结构、多空供需格局等对基差的影响变化 [20][21] - 机器学习模型最终入选的有效因子也随时间动态变化,预测时去除Importance值过高的因子防止模型失衡 [22][24] 全合约预测 - 将预测对象由单一合约拓展至全合约,保留对市场整体基差特征刻画的同时,实现对各合约基差走势的精细化研判 [25] - 不同合约基差的有效因子差别大,当月合约更具短期投机属性,受短期博弈影响大;当季合约更具中长期对冲属性,与市场投资风格及对冲需求强弱更相关 [27] 多模型融合 - 在原有截面因子模型基础上引入AR时间序列模型,形成截面信息+时序特征的双重预测逻辑,采用滚动窗口框架进行模型训练与回测,并同步执行滚动因子筛选与模型参数动态调优 [28] - 各模型在IC不同合约上表现有差异,时间序列模型方向准确度整体优于其他模型,线性回归模型弱于非线性模型,近月合约方向预测准确性更高,随机森林模型预测精度整体更优 [32][36] - 4模型结合后,IC各合约平均预测MSE约为0.0374,平均方向准确率约为61%;IH各合约平均预测MSE约为0.0282,平均方向准确率约62.46%;IF平均MSE为0.0274,平均方向准确率约61.29%;IM预测效果略低于其他品种,4模型结合后精度约为0.0525,方向准确性约为60.64% [38][40][48][50][51] 总结 - 对基差预测各环节拓展完善,包括加入新因子等四点内容 [65] - 以IC为例,不同合约基差与因子相关性有显著差别,近月合约偏投机,远月合约偏对冲,近月合约方向更易预测,远月预测值偏差更小 [65] - 因子相关性随时间变化,滚动筛选方式在不同合约、品种上效果不同 [65] - 时间序列模型方向准确性较好,机器学习模型预测精度更优 [65]
机器学习系列之九:Mamba-MoE:风险中性化与多模型融合
东北证券· 2025-05-29 15:41
量化模型与构建方式 1. **模型名称:Mamba-MoE** - **模型构建思路**:通过Mamba架构高效提取时间序列特征,结合混合专家模型(MoE)进行多模型融合,同时引入线性与非线性的风险约束以降低风险暴露[2][3][44]。 - **模型具体构建过程**: 1. **任务一(Alpha因子生成)**:使用Mamba模块处理股票特征序列(维度为`(batch_size, window_length, feature_num)`),通过卷积和SSM(选择性状态空间模型)提取时序特征,输出Alpha因子[27][30][32]。 - SSM离散化公式: $$\bar{A}=\exp(\Delta A),$$ $$\bar{B}=(\Delta A)^{-1}(\exp(\Delta A)-I)\Delta B.$$ 2. **任务二(非线性风险因子生成)**:构建异质图(节点为股票风险因子,边包括同行业关联和高相似度关联),通过图卷积生成非线性风险因子[47][48]。 3. **损失函数**:结合Alpha因子与风险因子的相关性惩罚项: $$L=MSE(\hat{y},y_1)+MSE(\hat{r},y_2)+\frac{\alpha}{d_R+1}\sum_{i=1}^{d_R+1}\rho(\hat{y},R_i)^2.$$ - **模型评价**:双任务学习显著降低风险暴露,提升因子稳定性;MoE融合增强模型泛化性[53][56][72]。 2. **模型名称:Mamba-10与Mamba-5** - **构建思路**:分别以10日和5日收益为标签训练模型,通过交叉验证生成多个子模型,等权或MoE融合[98][99]。 - **具体构建**:5折交叉验证扩展窗口训练,MoE路由器结合股票特征与市场特征动态加权[98][99]。 --- 量化因子与构建方式 1. **因子名称:Mamba-MoE合成因子** - **构建思路**:融合Mamba-5和Mamba-10的多模型输出,结合风险中性化约束[103][137]。 - **具体构建**: - 对Alpha因子进行行业市值中性化处理。 - 通过MoE加权合成,路由器输入包括股票特征和市场特征(如指数收益率、VIX等)[98][99]。 - **因子评价**:稳定性优于单模型,对市值暴露控制较好,但对低波动和低流动性有一定暴露[103][137]。 2. **因子名称:非线性风险因子** - **构建思路**:捕捉风险因子间非线性交互及股票关联信息[44][48]。 - **具体构建**:基于CNE6风险因子构建异质图,通过GNN生成非线性风险因子[48][49]。 --- 模型的回测效果 1. **Mamba-MoE模型** - Rank IC:13.22%,ICIR:1.28,多头年化收益:33.01%,多空Sharpe Ratio:9.25[103][137]。 - 沪深300增强年化超额收益:9.02%,跟踪误差:4.26%[156]。 2. **Mamba-10模型(双任务)** - Rank IC:12.83%,ICIR:1.28,多空最大回撤:11.71%[56][72]。 3. **行业风格中性化测试** - 双任务设定下Rank IC衰减至8.81%,但多空Sharpe Ratio仍达11.49[72]。 --- 因子的回测效果 1. **Mamba-MoE合成因子** - 全市场十分组测试:多空年化收益125.32%,波动率13.55%[103]。 - 分域测试(中证1000):Rank IC 11.12%,多空Sharpe Ratio 7.17[137]。 2. **非线性风险因子** - 与流动性因子相关性:-20.74%(双任务)[78][79]。 --- 关键创新点 - **风险中性化**:通过损失函数直接约束风险暴露,避免组合优化时的信号扭曲[44][50]。 - **多模型融合**:交叉验证与MoE集成缓解分布漂移问题,提升稳健性[2][98][99]。 - **高效计算**:Mamba的线性复杂度优于Transformer,支持并行训练[23][31]。