量化模型与构建方式 1. 模型名称:混频深度学习模型 - 模型构建思路:将日频和高频量价特征共同输入深度学习模型,通过延长训练和迭代周期,挖掘更多的增量信息[10][11][12] - 模型具体构建过程: 1. 输入特征:26个日频特征和64个60分钟频特征,分别提取股票的日度收益、价格形态、交易活跃度、流动性及日内微观结构[11][12] 2. 数据预处理:2013年5月之前的高频量价特征因数据完整性问题被填充为0[12] 3. 模型架构:采用两个独立的GRU模块分别提取日频和高频特征信息,随后通过MLP整合GRU输出并生成最终预测[12][13] 4. 训练设置: - 验证早停集:最近120个交易日的数据 - 训练集:1200个交易日的数据 - 模型迭代:每隔120个交易日迭代一次 - 损失函数:MSE[16][17][22] 5. 预测标签:未来5日收益率和未来10日收益率[17] 6. 重复训练:同一组超参的模型重复训练5次,推理时取均值作为输出[22] - 模型评价:通过将低频和高频特征一同输入深度学习模型,显著提升了IC、RankIC等指标,同时保持较高的ICIR和胜率[72] 2. 模型名称:正交深度学习模型 - 模型构建思路:在深度学习模型的MLP与输出层之间加入正交层,生成多个两两正交的因子集合[62][63] - 模型具体构建过程: 1. 添加正交层:在不改变模型整体架构及损失函数的前提下,通过线性变换实现因子正交[62] 2. 输出结果:生成32个因子,因子间的相关性绝大多数小于0.15,基本实现正交效果[63][64] 3. 扩展目标:可进一步生成与指定因子集合(如行业、市值、BP)正交且内部相互正交的因子集合[67] - 模型评价:正交约束后,因子集合的选股能力有所削弱,但实现了因子间的低相关性,适合挖掘增量因子[67][70] --- 模型的回测效果 1. 混频深度学习模型 - IC均值:周频因子IC均值为0.10,双周频和月频因子IC均值分别为0.11和0.12[19][39] - 年化ICIR:周频因子年化ICIR为7.853(未来10日因子)[19] - 胜率:周频因子胜率为87%-91%[19] - 多头组合年化超额收益: - TOP 10%组合:周频因子为29.4%-30.8%,双周频因子为20.9%-22.2%,月频因子为13.7%-15.5%[26][39] - TOP 100组合:周频因子为34.4%,双周频因子为22.7%-23.6%,月频因子为14.5%-16.1%[26][39] 2. 正交深度学习模型 - IC均值:相互正交因子IC均值为0.03-0.04,与行业、市值和BP正交的因子IC均值为0.015-0.025[66][70] - 胜率:相互正交因子胜率为71%-81%,与行业、市值和BP正交的因子胜率为59%-71%[66][70] - 多头组合年化超额收益: - 相互正交因子:TOP 10%组合为5%-12%[66] - 与行业、市值和BP正交的因子:TOP 10%组合为-0.6%-5.6%[70] --- 量化因子与构建方式 1. 因子名称:未来5日因子 - 因子构建思路:基于深度学习模型预测股票未来5日收益率[17] - 因子具体构建过程:以股票过去60个交易日的日频和高频量价特征序列为输入,训练深度学习模型,输出未来5日收益率预测[16][17] - 因子评价:表现优于未来10日因子,IC和胜率更高,但因子自相关性较低,换手率较高[19] 2. 因子名称:未来10日因子 - 因子构建思路:基于深度学习模型预测股票未来10日收益率[17] - 因子具体构建过程:与未来5日因子类似,但预测标签为未来10日收益率[17] - 因子评价:相比未来5日因子,换手率较低,但IC和胜率略逊一筹[19] --- 因子的回测效果 1. 未来5日因子 - IC均值:周频为0.104,双周频为0.111,月频为0.112[19][39] - 年化ICIR:周频为8.418[19] - 胜率:周频为91%[19] - 多头组合年化超额收益: - TOP 10%组合:周频为29.4%,双周频为20.9%,月频为13.7%[26][39] - TOP 100组合:周频为34.4%,双周频为22.7%,月频为14.5%[26][39] 2. 未来10日因子 - IC均值:周频为0.102,双周频为0.113,月频为0.116[19][39] - 年化ICIR:周频为7.853[19] - 胜率:周频为87%[19] - 多头组合年化超额收益: - TOP 10%组合:周频为30.8%,双周频为22.2%,月频为15.4%[26][39] - TOP 100组合:周频为34.4%,双周频为23.6%,月频为15.9%[26][39]
20230513_海通证券_金融工程专题_冯佳睿袁林青_选股因子系列研究(八十七)——高频与日度量价数据混合的深度学习因子
海通证券·2023-05-13 00:01