Workflow
公式化因子挖掘
icon
搜索文档
【广发金工】AlphaForge:基于梯度下降的因子挖掘
公式化因子挖掘与AlphaForge框架 - 神经网络模型能有效预测股票截面收益率差异,构造更多公式化特征可丰富模型输入[1] - 传统方法如遗传规划和OpenFE存在优化方向随机、过拟合等问题[3][9] - AlphaForge通过生成器和预测器设计实现梯度下降优化,解决传统方法缺陷[10][13][14] AlphaForge技术架构 - 生成器采用DCGAN网络和Masker结构,保证连续可导实现梯度传播[23][26][28] - 预测器使用卷积结构学习因子表达式与IC得分的对应关系[29] - 损失函数设计包含因子得分和多样性惩罚项[15] 因子挖掘效果 - 100个样本外因子IC均值4.24%,最高7.10%,最低2.29%,中位数4.34%[38][39] - 因子间截面相关性均值9.31%,时序相关性均值18.57%[43][44] - 因子表达式长度多在2-20之间,可解释性一般但有效性突出[46][47] 因子合成表现 - LGBM和等权合成因子IC均值分别为11.68%和13.29%,相关性54.23%[53] - 进一步合成后IC均值提升至13.85%,年化超额17.33%,回撤-5.41%[53] - 在沪深300、中证500、中证1000股票池中均表现稳定[58][60][64] 指数增强策略 - 沪深300指增年化超额9.28%,回撤-7.25%,信息比率1.90[74] - 中证500指增年化超额10.98%,回撤-10.65%[76][77] - 中证1000指增表现最优,年化超额14.28%,回撤-10.96%,信息比率2.27[79][80] 框架优势总结 - 相比传统方法实现梯度下降优化,避免随机生成缺陷[82] - 生成器-预测器结构保证因子生成的连续性和有效性[82] - 滚动训练验证显示框架在不同市场环境下的稳定性[33][82]