核心观点 报告系统性地构建了一套基于大语言模型与提示工程的自动化因子研究框架,旨在探索AI在量化投资全链条中的应用潜力。该框架成功应用于低频量价、基本面和高频数据的因子挖掘与优化,并利用大模型分析非结构化文本构建情绪因子。最终,通过融合AI生成的多维信息,构建的综合中证800指数增强策略实现了超额收益和信息比率的显著提升,验证了AI在量化研究中实现“1+1>2”效果的巨大潜力[1]。 低频量价因子的优化与生成 - 报告以Alpha158因子库为基础,通过人机交互的迭代循环,对经典量价因子进行深度优化与生成。例如,波动率因子std20经过优化后,其RankIC均值从4.03%提升至7.80%,ICIR从0.31提升至0.55[1][37]。 - AI能够识别原始因子的逻辑缺陷并提出有效改进方案。以std20因子为例,其改进方案引入了平均真实波幅和成交量加权机制,优化效果在5至60日的多个窗口期下均具备普适性[1][37][42]。 - 通过为模型提供已验证的“成功案例”作为先验知识,实现了从零生成新因子的突破,成功挖掘出多个与样例因子相关性低、ICIR在0.8以上的新因子。这些AI生成因子在样本外跟踪中表现持续稳健,部分因子的样本外ICIR能达到1.0以上[1]。 基本面因子挖掘 - 在基本面维度,AI展现出强大的因子发现能力,不仅能生成经典因子的增强版本,更能从新颖视角对价值、质量、成长三类因子进行有效拓展与创新[1]。 - 具体案例包括:从留存收益角度构建了REP_LF因子,从应收账款周转率角度构建了ART_QR因子,并生成了现金毛利CGP_TTM的增强版本[1]。 高频因子挖掘 - 在高频维度,通过赋予AI直接生成Python代码的能力,挖掘出一批逻辑新颖且表现优异的高频因子。其中部分强信号因子的多空组合年化收益超过60%[1]。 - 将AI高频因子库融入融合了日K与周K行情数据的AGRU神经网络模型后,模型的年化多头超额收益由18.24%显著提升至25.28%,RankIC均值提升了0.71个百分点[1]。 非结构化文本情绪分析 - 利用Gemini 2.5 Pro大模型对近百万字的上市公司调研纪要进行深度解析,并通过双速动态衰减模型构建了周度情绪因子[1]。 - 研究发现,该情绪因子呈现出独特的非对称预测能力,即正面情绪与股价上涨关系不强,但负面情绪是未来股价下跌的强预警信号,其空头组合年化超额收益达8.26%,显著优于传统因子。该因子与传统量价及基本面因子的相关性极低,可作为独立且有效的补充信息源[1]。 综合策略构建与效果 - 最终构建了一个多维信息融合的综合策略:将AI挖掘的高频因子与低频行情数据融合进AGRU神经网络,形成核心Alpha;再利用AI文本情绪因子对该核心Alpha进行空头端风险调整,构建了最终的中证800指数增强策略[1]。 - 与未加入调研因子调整的策略相比,最终策略在保持换手率基本不变的情况下,年化超额收益由11.15%提升至11.81%,信息比率由2.18提升至2.31,且近三年超额提升皆超过1个百分点[1]。
金工专题报告 20260110:深度学习系列之一:AI重塑量化,基于大语言模型驱动的因子改进与情绪Alpha挖掘
东吴证券·2026-01-10 19:09