不变学习 - 财报，业绩电话会，研报，新闻

不变学习

搜索文档

因子选股系列之一一五：DFQ-diversify：解决分布外泛化问题的自监督领域识别与对抗解耦模型

东方证券· 2025-05-07 15:45

量化模型与构建方式 1. **模型名称：DFQ-Diversify** - **模型构建思路**：通过自监督领域识别与对抗训练机制，实现标签预测任务与领域识别任务的显式解耦，以增强模型的分布外泛化能力[2][3][10] - **模型具体构建过程**： 1. **核心模块**： - **update_d模块**：执行领域识别任务，通过对抗机制抑制标签信息学习。包含特征提取器（GRU）、领域瓶颈层（dbottleneck）、领域分类器（dclassifier）和标签对抗判别器（ddiscriminator）。梯度反转层用于抑制标签预测能力[23][25][27] - **set_dlabel模块**：动态更新样本的潜在领域标签，通过无监督聚类优化领域划分[28][29] - **update模块**：执行标签预测任务，通过对抗机制抑制领域信息依赖。包含共享特征提取器、标签瓶颈层（bottleneck）、标签分类器（classifier）和领域对抗判别器（discriminator）[30][32][33] 2. **对抗训练机制**： - 模块间对抗：update_d与update共享特征提取器，目标相反形成动态博弈[43][44] - 模块内双损失：update_d优化领域预测损失（交叉熵）和标签对抗损失（MSE）；update优化标签预测损失（MSE）和领域对抗损失（交叉熵）[45][46] - 梯度反转层：在反向传播中反转梯度符号，实现特征解耦[47][48] 3. **动态领域划分**：通过自监督聚类在时间和截面维度识别潜在领域，满足领域内一致性高、领域间差异显著的标准[34][35][36] - **模型评价**：相比Factorvae-pro模型，Diversify无需预设环境变量，通过动态领域划分和对抗训练显著提升泛化能力，尤其在复杂市场环境中表现稳健[10][50][53] 2. **模型名称：GRU基础模型** - **模型构建思路**：作为对比基准，采用标准GRU结构进行标签预测，无领域解耦设计[55] - **模型具体构建过程**： - 输入60个量价特征，通过GRU层提取时序特征后直接预测20日收益率[55] --- 模型的回测效果 1. **DFQ-Diversify模型** - **中证全指股票池（2020-2024）**： - IC：12.41% | IC_IR：1.24 | rankIC：14.73% | rankIC_IR：1.29 - 多头年化超额收益：32.33% | 最大回撤：-7.55% | 换手率：74.08%[55] - **沪深300增强组合**： - 信息比率（IR）：1.89 | 年化超额收益：11.27%[6] - **中证500增强组合**： - 信息比率（IR）：1.67 | 年化超额收益：12.19%[6] 2. **GRU基础模型** - **中证全指股票池（2020-2024）**： - IC：12.01% | IC_IR：1.20 | rankIC：14.11% | rankIC_IR：1.30 - 多头年化超额收益：26.44% | 最大回撤：-6.80% | 换手率：78.20%[55] --- 关键参数与对比 1. **独立瓶颈层效果**： - 独立dbottleneck和bottleneck的Diversify模型（IC 12.41%）优于共享瓶颈层（IC 10.99%）和无瓶颈层（IC 11.81%）[60] 2. **双路径训练优势**： - 双路径训练的Diversify（rankIC 14.73%）显著优于单路径合并训练（rankIC 14.01%）[61][62] 3. **领域数量选择**： - latent_domain_num=2时模型表现最优（IC 12.41%），过多领域数（如domain_num=5）导致性能下降（IC 10.92%）[84] --- 因子绩效表现（中性化后） 1. **中证全指股票池**： - 中性化因子IC：11.02% | rankIC：13.15% | 多头年化超额收益：28.19%[48] --- 领域可视化分析 1. **领域分布**： - 训练中领域=1的占比从51.24%升至58.09%，反映模型对领域结构的自适应学习[63][79] - 领域标签同时包含时序（同一股票领域归属随时间变化）和截面（同一时间不同股票领域差异）信息[71][75][77]