Workflow
风险中性化
icon
搜索文档
机器学习系列之九:Mamba-MoE:风险中性化与多模型融合
东北证券· 2025-05-29 15:41
量化模型与构建方式 1. **模型名称:Mamba-MoE** - **模型构建思路**:通过Mamba架构高效提取时间序列特征,结合混合专家模型(MoE)进行多模型融合,同时引入线性与非线性的风险约束以降低风险暴露[2][3][44]。 - **模型具体构建过程**: 1. **任务一(Alpha因子生成)**:使用Mamba模块处理股票特征序列(维度为`(batch_size, window_length, feature_num)`),通过卷积和SSM(选择性状态空间模型)提取时序特征,输出Alpha因子[27][30][32]。 - SSM离散化公式: $$\bar{A}=\exp(\Delta A),$$ $$\bar{B}=(\Delta A)^{-1}(\exp(\Delta A)-I)\Delta B.$$ 2. **任务二(非线性风险因子生成)**:构建异质图(节点为股票风险因子,边包括同行业关联和高相似度关联),通过图卷积生成非线性风险因子[47][48]。 3. **损失函数**:结合Alpha因子与风险因子的相关性惩罚项: $$L=MSE(\hat{y},y_1)+MSE(\hat{r},y_2)+\frac{\alpha}{d_R+1}\sum_{i=1}^{d_R+1}\rho(\hat{y},R_i)^2.$$ - **模型评价**:双任务学习显著降低风险暴露,提升因子稳定性;MoE融合增强模型泛化性[53][56][72]。 2. **模型名称:Mamba-10与Mamba-5** - **构建思路**:分别以10日和5日收益为标签训练模型,通过交叉验证生成多个子模型,等权或MoE融合[98][99]。 - **具体构建**:5折交叉验证扩展窗口训练,MoE路由器结合股票特征与市场特征动态加权[98][99]。 --- 量化因子与构建方式 1. **因子名称:Mamba-MoE合成因子** - **构建思路**:融合Mamba-5和Mamba-10的多模型输出,结合风险中性化约束[103][137]。 - **具体构建**: - 对Alpha因子进行行业市值中性化处理。 - 通过MoE加权合成,路由器输入包括股票特征和市场特征(如指数收益率、VIX等)[98][99]。 - **因子评价**:稳定性优于单模型,对市值暴露控制较好,但对低波动和低流动性有一定暴露[103][137]。 2. **因子名称:非线性风险因子** - **构建思路**:捕捉风险因子间非线性交互及股票关联信息[44][48]。 - **具体构建**:基于CNE6风险因子构建异质图,通过GNN生成非线性风险因子[48][49]。 --- 模型的回测效果 1. **Mamba-MoE模型** - Rank IC:13.22%,ICIR:1.28,多头年化收益:33.01%,多空Sharpe Ratio:9.25[103][137]。 - 沪深300增强年化超额收益:9.02%,跟踪误差:4.26%[156]。 2. **Mamba-10模型(双任务)** - Rank IC:12.83%,ICIR:1.28,多空最大回撤:11.71%[56][72]。 3. **行业风格中性化测试** - 双任务设定下Rank IC衰减至8.81%,但多空Sharpe Ratio仍达11.49[72]。 --- 因子的回测效果 1. **Mamba-MoE合成因子** - 全市场十分组测试:多空年化收益125.32%,波动率13.55%[103]。 - 分域测试(中证1000):Rank IC 11.12%,多空Sharpe Ratio 7.17[137]。 2. **非线性风险因子** - 与流动性因子相关性:-20.74%(双任务)[78][79]。 --- 关键创新点 - **风险中性化**:通过损失函数直接约束风险暴露,避免组合优化时的信号扭曲[44][50]。 - **多模型融合**:交叉验证与MoE集成缓解分布漂移问题,提升稳健性[2][98][99]。 - **高效计算**:Mamba的线性复杂度优于Transformer,支持并行训练[23][31]。