量化模型与构建方式 1. 模型名称:DFQ-Diversify - 模型构建思路:通过自监督领域识别与对抗训练机制,实现标签预测任务与领域识别任务的显式解耦,以增强模型的分布外泛化能力[2][3][10] - 模型具体构建过程: 1. 核心模块: - update_d模块:执行领域识别任务,通过对抗机制抑制标签信息学习。包含特征提取器(GRU)、领域瓶颈层(dbottleneck)、领域分类器(dclassifier)和标签对抗判别器(ddiscriminator)。梯度反转层用于抑制标签预测能力[23][25][27] - set_dlabel模块:动态更新样本的潜在领域标签,通过无监督聚类优化领域划分[28][29] - update模块:执行标签预测任务,通过对抗机制抑制领域信息依赖。包含共享特征提取器、标签瓶颈层(bottleneck)、标签分类器(classifier)和领域对抗判别器(discriminator)[30][32][33] 2. 对抗训练机制: - 模块间对抗:update_d与update共享特征提取器,目标相反形成动态博弈[43][44] - 模块内双损失:update_d优化领域预测损失(交叉熵)和标签对抗损失(MSE);update优化标签预测损失(MSE)和领域对抗损失(交叉熵)[45][46] - 梯度反转层:在反向传播中反转梯度符号,实现特征解耦[47][48] 3. 动态领域划分:通过自监督聚类在时间和截面维度识别潜在领域,满足领域内一致性高、领域间差异显著的标准[34][35][36] - 模型评价:相比Factorvae-pro模型,Diversify无需预设环境变量,通过动态领域划分和对抗训练显著提升泛化能力,尤其在复杂市场环境中表现稳健[10][50][53] 2. 模型名称:GRU基础模型 - 模型构建思路:作为对比基准,采用标准GRU结构进行标签预测,无领域解耦设计[55] - 模型具体构建过程: - 输入60个量价特征,通过GRU层提取时序特征后直接预测20日收益率[55] --- 模型的回测效果 1. DFQ-Diversify模型 - 中证全指股票池(2020-2024): - IC:12.41% | IC_IR:1.24 | rankIC:14.73% | rankIC_IR:1.29 - 多头年化超额收益:32.33% | 最大回撤:-7.55% | 换手率:74.08%[55] - 沪深300增强组合: - 信息比率(IR):1.89 | 年化超额收益:11.27%[6] - 中证500增强组合: - 信息比率(IR):1.67 | 年化超额收益:12.19%[6] 2. GRU基础模型 - 中证全指股票池(2020-2024): - IC:12.01% | IC_IR:1.20 | rankIC:14.11% | rankIC_IR:1.30 - 多头年化超额收益:26.44% | 最大回撤:-6.80% | 换手率:78.20%[55] --- 关键参数与对比 1. 独立瓶颈层效果: - 独立dbottleneck和bottleneck的Diversify模型(IC 12.41%)优于共享瓶颈层(IC 10.99%)和无瓶颈层(IC 11.81%)[60] 2. 双路径训练优势: - 双路径训练的Diversify(rankIC 14.73%)显著优于单路径合并训练(rankIC 14.01%)[61][62] 3. 领域数量选择: - latent_domain_num=2时模型表现最优(IC 12.41%),过多领域数(如domain_num=5)导致性能下降(IC 10.92%)[84] --- 因子绩效表现(中性化后) 1. 中证全指股票池: - 中性化因子IC:11.02% | rankIC:13.15% | 多头年化超额收益:28.19%[48] --- 领域可视化分析 1. 领域分布: - 训练中领域=1的占比从51.24%升至58.09%,反映模型对领域结构的自适应学习[63][79] - 领域标签同时包含时序(同一股票领域归属随时间变化)和截面(同一时间不同股票领域差异)信息[71][75][77]
因子选股系列之一一五:DFQ-diversify:解决分布外泛化问题的自监督领域识别与对抗解耦模型
东方证券·2025-05-07 15:45