量化模型与构建方式 1. 模型名称:Mamba-MoE - 模型构建思路:通过Mamba架构高效提取时间序列特征,结合混合专家模型(MoE)进行多模型融合,同时引入线性与非线性的风险约束以降低风险暴露[2][3][44]。 - 模型具体构建过程: 1. 任务一(Alpha因子生成):使用Mamba模块处理股票特征序列(维度为(batch_size, window_length, feature_num)
),通过卷积和SSM(选择性状态空间模型)提取时序特征,输出Alpha因子[27][30][32]。 - SSM离散化公式: 2. 任务二(非线性风险因子生成):构建异质图(节点为股票风险因子,边包括同行业关联和高相似度关联),通过图卷积生成非线性风险因子[47][48]。 3. 损失函数:结合Alpha因子与风险因子的相关性惩罚项: - 模型评价:双任务学习显著降低风险暴露,提升因子稳定性;MoE融合增强模型泛化性[53][56][72]。 2. 模型名称:Mamba-10与Mamba-5 - 构建思路:分别以10日和5日收益为标签训练模型,通过交叉验证生成多个子模型,等权或MoE融合[98][99]。 - 具体构建:5折交叉验证扩展窗口训练,MoE路由器结合股票特征与市场特征动态加权[98][99]。 --- 量化因子与构建方式 1. 因子名称:Mamba-MoE合成因子 - 构建思路:融合Mamba-5和Mamba-10的多模型输出,结合风险中性化约束[103][137]。 - 具体构建: - 对Alpha因子进行行业市值中性化处理。 - 通过MoE加权合成,路由器输入包括股票特征和市场特征(如指数收益率、VIX等)[98][99]。 - 因子评价:稳定性优于单模型,对市值暴露控制较好,但对低波动和低流动性有一定暴露[103][137]。 2. 因子名称:非线性风险因子 - 构建思路:捕捉风险因子间非线性交互及股票关联信息[44][48]。 - 具体构建:基于CNE6风险因子构建异质图,通过GNN生成非线性风险因子[48][49]。 --- 模型的回测效果 1. Mamba-MoE模型 - Rank IC:13.22%,ICIR:1.28,多头年化收益:33.01%,多空Sharpe Ratio:9.25[103][137]。 - 沪深300增强年化超额收益:9.02%,跟踪误差:4.26%[156]。 2. Mamba-10模型(双任务) - Rank IC:12.83%,ICIR:1.28,多空最大回撤:11.71%[56][72]。 3. 行业风格中性化测试 - 双任务设定下Rank IC衰减至8.81%,但多空Sharpe Ratio仍达11.49[72]。 --- 因子的回测效果 1. Mamba-MoE合成因子 - 全市场十分组测试:多空年化收益125.32%,波动率13.55%[103]。 - 分域测试(中证1000):Rank IC 11.12%,多空Sharpe Ratio 7.17[137]。 2. 非线性风险因子 - 与流动性因子相关性:-20.74%(双任务)[78][79]。 --- 关键创新点 - 风险中性化:通过损失函数直接约束风险暴露,避免组合优化时的信号扭曲[44][50]。 - 多模型融合:交叉验证与MoE集成缓解分布漂移问题,提升稳健性[2][98][99]。 - 高效计算:Mamba的线性复杂度优于Transformer,支持并行训练[23][31]。
机器学习系列之九:Mamba-MoE:风险中性化与多模型融合
东北证券·2025-05-29 15:41