Workflow
深度学习因子选股体系
icon
搜索文档
量化选股策略周报:指增组合本周超额回撤-20250816
财通证券· 2025-08-16 21:04
核心观点 - 报告基于深度学习框架构建alpha和风险模型,打造AI体系下的低频指数增强策略,组合周度调仓,年单边换手率约5.5倍[5][13] - 通过组合优化勾连深度学习alpha信号与风险信号构建沪深300、中证500和中证1000指数增强组合[5][13] - 在alpha维度利用多源特征集合,堆叠多模型策略,通过异构网络的特征互补与集成算法的权重优化得到alpha信号[13] - 在风险维度利用神经网络寻找长期IC均值为0,同时呈现出高R方的风险信号[13] 本周市场指数表现 - 截至2025-08-15,本周上证指数上涨1.70%,深证成指上涨4.55%,沪深300上涨2.37%,上证指数创2022年以来新高[5][8] - 创业板指本周上涨8.58%,科创50上涨5.53%,北证50上涨2.40%[9] - 通信、电子、非银金融行业表现较好,周收益率分别为7.66%、7.02%、6.48%[9] - 银行、钢铁、纺织服饰行业表现较差,周收益率分别为-3.19%、-2.04%、-1.37%[9] 跟踪组合表现 沪深300指数增强 - 今年以来沪深300指数上涨6.8%,沪深300指数增强组合上涨17.1%,超额收益10.3%[5][17] - 本周沪深300指数上涨2.4%,沪深300指数增强组合上涨1.8%,超额收益-0.6%[5][17] - 全样本期间组合年化收益19.2%,超额收益14.2%,月度胜率79.7%[18] 中证500指数增强 - 今年以来中证500指数上涨14.7%,中证500指数增强组合上涨21.6%,超额收益6.9%[5][22] - 本周中证500指数上涨3.9%,中证500指数增强组合上涨3.5%,超额收益-0.4%[5][22] - 全样本期间组合年化收益24.2%,超额收益17.3%,月度胜率81.0%[23] 中证1000指数增强 - 今年以来中证1000指数上涨19.5%,中证1000指数增强组合上涨29.4%,超额收益9.9%[5][29] - 本周中证1000指数上涨4.1%,中证1000指数增强组合上涨3.2%,超额收益-0.9%[5][29] - 全样本期间组合年化收益31.3%,超额收益24.2%,月度胜率87.3%[30]
金融工程专题报告:深度学习因子选股体系
财通证券· 2025-08-01 15:47
核心观点 - 采用"时序+截面"基础架构设计五类差异化网络结构,模型间平均相关性仅55% [3] - 通过线性等权、树模型与专家网络三类加权方式集成数百个神经网络特征,综合因子自2019年以来5日IC均值13.3%,10日IC均值15.0%,多头组合超额收益49.0% [3] - 使用神经网络端到端学习直接从原始量价数据识别高维非线性风险模式,风险因子长期不暴露alpha且对截面收益解释能力强 [3] - 沪深300指数增强组合年化收益18.2%,超额收益14.2%;中证500增强年化收益22.4%,超额收益17.2%;中证1000增强年化收益29.8%,超额收益24.5% [3] 深度学习选股策略 - 从传统多因子模型的"逻辑驱动"转向"数据驱动",通过深度学习挖掘高频数据非线性模式 [7] - 构建"原始数据→自动特征提取→因子合成"端到端框架,融合日度行情、分钟行情、手工特征等多模态数据 [7] - 采用差异化网络结构在单一数据集多次训练获取增量信息,通过多类别因子集成提升alpha信号稳健性 [8] - 使用神经网络端到端学习直接从量价数据识别风险模式,实现alpha模型和风险模型双重赋能 [9] - 采用长预测窗口和回看周期构建alpha信号,融合基本面信息减缓信号衰减,适配低换手交易模式 [10] 数据与网络架构 - 使用日度行情、分钟行情和手工特征三类数据集独立提取alpha特征 [11] - 日度行情预处理:价格数据对数变换为收益率,成交量/额通过序列均值标准化 [12][13] - 分钟行情采用与日行情一致预处理方案,保持日间价格连续性 [14][15] - 基础统计特征直接使用原始数据,选股因子采用截面z-score标准化 [16] - 网络结构融合LSTM(捕捉时序依赖)和GAT(建模截面关联),加入自注意力机制强化关键时点权重 [18][19][20] - 基础复合模型在时序网络和截面网络组合基础上构建5类差异化结构,模型间因子相关性均值60% [21][22][56] 模型训练与因子提取 - 采用滚动时间窗口训练策略,前七年数据训练,最近两年验证 [24] - 损失函数采用MSE加相关性正则项抑制特征冗余 [26] - 预测目标为股票未来Alpha收益,基于同类股票平均收益基准计算 [27] - 日度行情模型显示150日序列因子相比30日序列在2023年后未出现明显衰减 [30][32] - CNN-RNN-GAT模型通过卷积层聚合长序列信息,因子与RNN-GAT模型相关性62% [33][38] - RNN-GAT2模型调整邻接矩阵定义,因子与原始模型相关性62% [39][43] - 引入基本面信息的RNN-GAT2-Funda模型多头超额提升至39.1%,因子相关性降至55% [45][47] Alpha信号集成 - 10个模型生成640个信号,模型间平均相关性55% [66][68] - 等权集成因子5日IC均值12.9%,10日IC均值14.5%,多头超额42.7% [69][70] - 树模型加权采用3年训练窗口,集成信号5日IC均值11.7%,多头超额46.1% [73][74] - 神经网络加权采用TCN多专家架构,5日IC均值12.3%,多头超额44.9% [81][83] - 综合等权、树模型和网络模型信号,最终5日IC均值13.3%,10日IC均值15.0%,多头超额49.0% [84][86] 指数增强组合 - 沪深300增强年化超额14.2%,跟踪误差4.5%,信息比率2.84 [99][101] - 中证500增强年化超额17.2%,跟踪误差4.8%,信息比率3.16 [106][107] - 中证1000增强年化超额24.5%,跟踪误差5.4%,信息比率3.87 [111][113] - 组合构建约束单周换手上限10%,年单边换手率约5.5倍,成分股权重下限80% [93][95]