Workflow
金融工程专题报告:深度学习因子选股体系
财通证券·2025-08-01 15:47

核心观点 - 采用"时序+截面"基础架构设计五类差异化网络结构,模型间平均相关性仅55% [3] - 通过线性等权、树模型与专家网络三类加权方式集成数百个神经网络特征,综合因子自2019年以来5日IC均值13.3%,10日IC均值15.0%,多头组合超额收益49.0% [3] - 使用神经网络端到端学习直接从原始量价数据识别高维非线性风险模式,风险因子长期不暴露alpha且对截面收益解释能力强 [3] - 沪深300指数增强组合年化收益18.2%,超额收益14.2%;中证500增强年化收益22.4%,超额收益17.2%;中证1000增强年化收益29.8%,超额收益24.5% [3] 深度学习选股策略 - 从传统多因子模型的"逻辑驱动"转向"数据驱动",通过深度学习挖掘高频数据非线性模式 [7] - 构建"原始数据→自动特征提取→因子合成"端到端框架,融合日度行情、分钟行情、手工特征等多模态数据 [7] - 采用差异化网络结构在单一数据集多次训练获取增量信息,通过多类别因子集成提升alpha信号稳健性 [8] - 使用神经网络端到端学习直接从量价数据识别风险模式,实现alpha模型和风险模型双重赋能 [9] - 采用长预测窗口和回看周期构建alpha信号,融合基本面信息减缓信号衰减,适配低换手交易模式 [10] 数据与网络架构 - 使用日度行情、分钟行情和手工特征三类数据集独立提取alpha特征 [11] - 日度行情预处理:价格数据对数变换为收益率,成交量/额通过序列均值标准化 [12][13] - 分钟行情采用与日行情一致预处理方案,保持日间价格连续性 [14][15] - 基础统计特征直接使用原始数据,选股因子采用截面z-score标准化 [16] - 网络结构融合LSTM(捕捉时序依赖)和GAT(建模截面关联),加入自注意力机制强化关键时点权重 [18][19][20] - 基础复合模型在时序网络和截面网络组合基础上构建5类差异化结构,模型间因子相关性均值60% [21][22][56] 模型训练与因子提取 - 采用滚动时间窗口训练策略,前七年数据训练,最近两年验证 [24] - 损失函数采用MSE加相关性正则项抑制特征冗余 [26] - 预测目标为股票未来Alpha收益,基于同类股票平均收益基准计算 [27] - 日度行情模型显示150日序列因子相比30日序列在2023年后未出现明显衰减 [30][32] - CNN-RNN-GAT模型通过卷积层聚合长序列信息,因子与RNN-GAT模型相关性62% [33][38] - RNN-GAT2模型调整邻接矩阵定义,因子与原始模型相关性62% [39][43] - 引入基本面信息的RNN-GAT2-Funda模型多头超额提升至39.1%,因子相关性降至55% [45][47] Alpha信号集成 - 10个模型生成640个信号,模型间平均相关性55% [66][68] - 等权集成因子5日IC均值12.9%,10日IC均值14.5%,多头超额42.7% [69][70] - 树模型加权采用3年训练窗口,集成信号5日IC均值11.7%,多头超额46.1% [73][74] - 神经网络加权采用TCN多专家架构,5日IC均值12.3%,多头超额44.9% [81][83] - 综合等权、树模型和网络模型信号,最终5日IC均值13.3%,10日IC均值15.0%,多头超额49.0% [84][86] 指数增强组合 - 沪深300增强年化超额14.2%,跟踪误差4.5%,信息比率2.84 [99][101] - 中证500增强年化超额17.2%,跟踪误差4.8%,信息比率3.16 [106][107] - 中证1000增强年化超额24.5%,跟踪误差5.4%,信息比率3.87 [111][113] - 组合构建约束单周换手上限10%,年单边换手率约5.5倍,成分股权重下限80% [93][95]