Workflow
20230911_海通证券_金融工程专题_冯佳睿 袁林青_选股因子系列研究(八十八)——多颗粒度特征的深度学习模型:探索和对比(1)
海通证券·2023-09-11 00:01

量化模型与构建方式 单颗粒度模型 - 模型名称:单颗粒度模型 - 模型构建思路:使用单一频率的量价特征(如日度、小时级、30分钟级)作为输入,训练深度学习模型,评估不同频率特征的因子有效性[11][12] - 模型具体构建过程: 1. 构建不同频率的量价特征(如日度、60分钟、30分钟) 2. 使用相同的网络结构和超参数训练模型 3. 评估因子的Rank IC、ICIR、多头超额收益等指标[11][12] - 模型评价:日度特征的因子表现整体优于高频特征,但高频特征在部分年份中表现更优,说明高频特征仍有增量信息[13][14] 多颗粒度模型 - 模型名称:多颗粒度模型 - 模型构建思路:融合不同频率的特征信息,通过两种方式实现:混合输入和输出集成[15][16] - 模型具体构建过程: 1. 混合输入:将不同颗粒度的特征作为输入,通过独立的GRU提取序列信息,合并GRU输出后通过MLP生成最终输出[15] 2. 输出集成:分别训练每个颗粒度的特征,生成对标签的预测,最终通过简单平均等方式集成不同颗粒度的输出[15] - 模型评价:多颗粒度模型相比单颗粒度模型在Rank IC和年化多头超额收益上均有显著提升,输出集成方式效果最佳[16][17][18] 双向AGRU多颗粒度模型 - 模型名称:双向AGRU多颗粒度模型 - 模型构建思路:在传统GRU基础上引入注意力机制,并改为双向结构,分别按顺序和逆序学习特征序列,缓解信息遗忘问题[22][24] - 模型具体构建过程: 1. 引入注意力机制,对历史隐含状态进行加权[23] 2. 将GRU从单向改为双向,分别提取顺序和逆序的特征信息[24] 3. 使用双向AGRU训练多颗粒度模型,评估其选股能力[27][30] - 模型评价:双向AGRU显著提升了Rank IC、ICIR和多头超额收益,表现全面而稳定[27][33][36] 多颗粒度残差学习网络 - 模型名称:多颗粒度残差学习网络 - 模型构建思路:通过残差剔除不同颗粒度特征的冗余信息,仅保留特有信息,并集成各颗粒度的预测[46][47] - 模型具体构建过程: 1. 将多个相同模块叠加,每个模块单独处理一个颗粒度的数据 2. 从第二个模块起,通过残差剔除前一颗粒度已包含的信息 3. 使用线性变换对齐特征维度,计算残差 4. 集成各颗粒度的预测,生成最终输出 5. 损失函数包括MSE、重构损失项和L2正则项,公式如下: L=i=1Nyiy^i2+λ1i=1NLRec+λθ2θF2{\mathcal{L}}=\sum_{i=1}^{N}||y^{i}-{\hat{y}}^{i}||^{2}+\lambda_{1}\sum_{i=1}^{N}{\mathcal{L}}_{R e c}+{\frac{\lambda_{\theta}}{2}}||\theta||_{F}^{2}[47][50] - 模型评价:未展现显著优势,整体表现弱于输出集成模型,可能与超参数选择有关[51][53] --- 模型的回测效果 单颗粒度模型 - 指标值: - Rank IC:日度0.118,60分钟0.116,30分钟0.119(5日标签)[12] - ICIR:日度7.54,60分钟7.35,30分钟7.56(5日标签)[12] - Top10%组合年化超额收益(费前):日度30.3%,60分钟27.1%,30分钟28.7%(5日标签)[12] 多颗粒度模型 - 指标值: - Rank IC:混合输入0.121,输出集成0.122,输出集成1 0.123(5日标签)[17] - ICIR:混合输入7.83,输出集成7.63,输出集成1 7.71(5日标签)[32] - Top10%组合年化超额收益(费前):混合输入30.8%,输出集成30.6%,输出集成1 31.4%(5日标签)[32] 双向AGRU多颗粒度模型 - 指标值: - Rank IC:混合输入0.125,输出集成0.126,输出集成1 0.127(5日标签)[32] - ICIR:混合输入8.09,输出集成7.87,输出集成1 7.88(5日标签)[32] - Top10%组合年化超额收益(费前):混合输入34.5%,输出集成33.6%,输出集成1 34.2%(5日标签)[32] 多颗粒度残差学习网络 - 指标值: - Rank IC:日度0.118,30分钟0.119,输出集成0.123[48] - ICIR:日度7.54,30分钟7.56,输出集成7.71[48] - Top10%组合年化超额收益(费前):日度30.3%,30分钟28.7%,输出集成31.4%[48] --- AI指数增强组合的回测效果 中证500 AI增强组合 - 指标值: - 年化超额收益(无成分股约束):15%-20%(2017-2023.07)[57] - YTD超额收益(无成分股约束):10%-16%(2023)[57] - 年化超额收益(80%成分股权重约束):10%-15%(2017-2023.07)[61] - YTD超额收益(80%成分股权重约束):7%-12%(2023)[61] 中证1000 AI增强组合 - 指标值: - 年化超额收益(无成分股约束):25%-30%(2017-2023.07)[65] - YTD超额收益(无成分股约束):15%-18%(2023)[65] - 年化超额收益(80%成分股权重约束):22%-28%(2017-2023.07)[66] - YTD超额收益(80%成分股权重约束):11%-16%(2023)[66]