不变学习

搜索文档
因子选股系列之一一五:DFQ-diversify:解决分布外泛化问题的自监督领域识别与对抗解耦模型
东方证券· 2025-05-07 15:45
量化模型与构建方式 1. **模型名称:DFQ-Diversify** - **模型构建思路**:通过自监督领域识别与对抗训练机制,实现标签预测任务与领域识别任务的显式解耦,以增强模型的分布外泛化能力[2][3][10] - **模型具体构建过程**: 1. **核心模块**: - **update_d模块**:执行领域识别任务,通过对抗机制抑制标签信息学习。包含特征提取器(GRU)、领域瓶颈层(dbottleneck)、领域分类器(dclassifier)和标签对抗判别器(ddiscriminator)。梯度反转层用于抑制标签预测能力[23][25][27] - **set_dlabel模块**:动态更新样本的潜在领域标签,通过无监督聚类优化领域划分[28][29] - **update模块**:执行标签预测任务,通过对抗机制抑制领域信息依赖。包含共享特征提取器、标签瓶颈层(bottleneck)、标签分类器(classifier)和领域对抗判别器(discriminator)[30][32][33] 2. **对抗训练机制**: - 模块间对抗:update_d与update共享特征提取器,目标相反形成动态博弈[43][44] - 模块内双损失:update_d优化领域预测损失(交叉熵)和标签对抗损失(MSE);update优化标签预测损失(MSE)和领域对抗损失(交叉熵)[45][46] - 梯度反转层:在反向传播中反转梯度符号,实现特征解耦[47][48] 3. **动态领域划分**:通过自监督聚类在时间和截面维度识别潜在领域,满足领域内一致性高、领域间差异显著的标准[34][35][36] - **模型评价**:相比Factorvae-pro模型,Diversify无需预设环境变量,通过动态领域划分和对抗训练显著提升泛化能力,尤其在复杂市场环境中表现稳健[10][50][53] 2. **模型名称:GRU基础模型** - **模型构建思路**:作为对比基准,采用标准GRU结构进行标签预测,无领域解耦设计[55] - **模型具体构建过程**: - 输入60个量价特征,通过GRU层提取时序特征后直接预测20日收益率[55] --- 模型的回测效果 1. **DFQ-Diversify模型** - **中证全指股票池(2020-2024)**: - IC:12.41% | IC_IR:1.24 | rankIC:14.73% | rankIC_IR:1.29 - 多头年化超额收益:32.33% | 最大回撤:-7.55% | 换手率:74.08%[55] - **沪深300增强组合**: - 信息比率(IR):1.89 | 年化超额收益:11.27%[6] - **中证500增强组合**: - 信息比率(IR):1.67 | 年化超额收益:12.19%[6] 2. **GRU基础模型** - **中证全指股票池(2020-2024)**: - IC:12.01% | IC_IR:1.20 | rankIC:14.11% | rankIC_IR:1.30 - 多头年化超额收益:26.44% | 最大回撤:-6.80% | 换手率:78.20%[55] --- 关键参数与对比 1. **独立瓶颈层效果**: - 独立dbottleneck和bottleneck的Diversify模型(IC 12.41%)优于共享瓶颈层(IC 10.99%)和无瓶颈层(IC 11.81%)[60] 2. **双路径训练优势**: - 双路径训练的Diversify(rankIC 14.73%)显著优于单路径合并训练(rankIC 14.01%)[61][62] 3. **领域数量选择**: - latent_domain_num=2时模型表现最优(IC 12.41%),过多领域数(如domain_num=5)导致性能下降(IC 10.92%)[84] --- 因子绩效表现(中性化后) 1. **中证全指股票池**: - 中性化因子IC:11.02% | rankIC:13.15% | 多头年化超额收益:28.19%[48] --- 领域可视化分析 1. **领域分布**: - 训练中领域=1的占比从51.24%升至58.09%,反映模型对领域结构的自适应学习[63][79] - 领域标签同时包含时序(同一股票领域归属随时间变化)和截面(同一时间不同股票领域差异)信息[71][75][77]