Workflow
Master因子
icon
搜索文档
AI量化的当下与未来
华泰证券· 2026-01-25 10:55
AI量化模型与因子总结 量化模型与构建方式 1. **模型名称:AI全频段量价模型** * **模型构建思路**:采用端到端建模范式,直接对原始量价数据进行学习,从低频(日、周、月频)逐步拓展至高频(逐笔成交、Level2)数据,旨在捕捉不同时间尺度下量价数据的内在联系与市场微观结构模式[3][17]。 * **模型具体构建过程**: * **低频多任务学习模型**:模型同时接收日频、周频和月频三种不同颗粒度的K线数据,采用同一个GRU模块提取时序信息,实现知识共享[19]。 * **PatchModel(长时间序列建模)**:借鉴分块思想,将长时间序列量价数据按交易日划分为多个patch,以缓解信息遗忘问题[22]。 * **PatchModel1**:使用GRU处理日内时序数据,再通过注意力机制构建日间联系[22][23]。 * **PatchModel2**:将日内时点信息拆解为不同特征,再使用GRU挖掘日间的时序规律[22][23]。 * **基于逐笔成交的深度学习模型**:从资金流和事件驱动角度构建特征,利用Transformer模型学习多维注意力规律[24]。 * **资金流模型**:根据等时间、等成交笔数、等成交量、等价格波动对逐笔成交数据进行采样,形成4种结构化K线。构建双层Transformer模型,第一层学习时序注意力,第二层学习跨K线注意力,最终输出个股未来收益预测[24][30]。 * **基于Level2数据图像的选股模型**:将高频逐笔成交与委托数据转换为标准化的三维图像格式(通道数、价格区间、成交量/委托量区间),应用Vision Transformer(ViT)及Video Vision Transformer(ViViT)进行模式识别,提取微观结构信息[27][28]。 * **模型评价**:作为一种具备长期价值的研究范式,端到端框架尝试在统一的表示空间中学习市场原始数据的内在联系,使量价研究从局部经验驱动迈向整体结构感知[17]。 2. **模型名称:Master模型** * **模型构建思路**:基于Transformer架构,通过新增变量间注意力层,实现对股票特征在时序上、股票间、特征间的关联变化进行协同建模[55]。 * **模型具体构建过程**:模型在时序注意力层的基础上,通过特定方式新增了变量间注意力层,以增强多变量协同建模能力[55]。具体网络结构可参考图表23[64]。 3. **模型名称:HIST模型** * **模型构建思路**:利用图神经网络(GNN)进行多变量相关性建模,通过多层残差图结构捕获股票间显式的行业板块关联、隐式的风格概念关联以及剩余的特征性收益[54]。 * **模型具体构建过程**:在注意力机制加持下,模型构建多层残差图结构来充分提取股票间的复杂关联信息[54]。具体网络结构可参考图表19[61]。 4. **模型名称:Crossformer模型** * **模型构建思路**:基于Transformer架构,专注于多变量协同建模,其底层模型结构在时序注意力层的基础上新增了变量间注意力层[55]。 * **模型具体构建过程**:通过改进的注意力机制实现对股票特征在时序和横截面上关联变化的协同建模[55]。具体网络结构可参考图表20[62]。 5. **模型名称:PortfolioNet系列模型** * **模型构建思路**:实现从收益预测到组合决策的端到端打通,旨在填平预测与交易之间的鸿沟,让模型直接对组合决策结果负责[5][112]。 * **模型具体构建过程**: * **PortfolioNet**:模型前端基于量价数据生成信号,随后经过可微优化层(如LinSAT)投影为合规的组合权重,组合收益直接参与损失计算并反向传播,实现一站式建模[112]。 * **PortfolioNet 2.0**:在前期模型基础上,对组合约束项赋予可微性能,让AI量价因子在追求高收益弹性的同时,也能捕捉Pure Alpha之外的风格收益[113]。 6. **模型名称:多粒度对比学习框架(CMLF)** * **模型构建思路**:解决直接融合不同粒度量价数据时面临的粒度不一致性和市场状态变化挑战,通过对比学习机制学习有效的股票表征,并动态调整特征融合方式[36]。 * **模型具体构建过程**: * **预训练阶段**:设计跨粒度对比和跨时间对比两种机制,以学习更有效的股票表征[36]。 * **特征融合阶段**:引入自适应门控机制,动态调节不同粒度特征的融合权重[36]。 7. **模型名称:多周期学习框架(MLF)** * **模型构建思路**:包含核心模块以消除周期间冗余信息、融合各周期预测结果,并确保数据一致性以降低模型偏差[40]。 * **模型具体构建过程**:包含三个核心模块:周期间冗余过滤(IRF)、可学习加权集成(LWI)和多周期自适应分块(MAP)[40]。 8. **模型名称:模态感知Transformer(MAT)** * **模型构建思路**:旨在提升深度学习模型挖掘跨模态交互信息的能力,通过引入特征级注意力层识别各模态中最相关的特征[42]。 * **模型具体构建过程**:设计三种多头注意力机制:模态内注意力(捕捉单模态内部时间依赖)、模态间注意力(探索不同模态间关联)和目标模态注意力(在解码阶段捕捉目标序列与各输入模态间的交互作用)[42]。 9. **模型名称:非平稳Transformer** * **模型构建思路**:针对金融时间序列的非平稳特性,改造Transformer底层架构,使模型能感知并适应数据分布的变化[77]。 * **模型具体构建过程**:保留数据预处理时描述原始数据分布特征的参数(如均值、方差),将注意力机制中计算的自注意力权重按照从原始数据分布特征中学到的平稳因子进行放缩,从而将数据分布统计特征引入注意力模块[77]。 10. **模型/框架名称:LLM-FADT文本策略** * **模型构建思路**:借助大语言模型(LLM)对上市公司相关研报、新闻文本进行深度理解,将另类数据中的情绪因子转化为交易信号[6][51]。 * **模型具体构建过程**:利用大模型深入挖掘文本数据,通过数据增强、分域建模的思想将文本情绪因子与AI模型相结合[51][52]。 11. **模型/框架名称:舆情分诊台(LLMRouter-GRU)** * **模型构建思路**:借助大模型挖掘新闻舆情文本,通过分域建模的思想将情绪因子与AI量价因子相结合,赋能选股模型[51]。 * **模型具体构建过程**:利用大模型处理新闻舆情文本,构建情绪因子,并将其与GRU等量价模型结合进行选股[51]。 12. **模型名称:3S-Trader** * **模型构建思路**:一个多LLM框架,用于自适应股票评分、策略制定和组合优化中的标的筛选,整合多源信息并提供可解释的策略优化方向[125]。 * **模型具体构建过程**:通过多个LLM代理分别分析新闻、财报和技术指标,对每只股票生成多维评分,再结合策略迭代模块进行组合构建与调整[125]。 13. **模型名称:MoEDRLPM** * **模型构建思路**:基于混合专家(Mixture of Experts)的深度强化学习组合模型,旨在通过动态切换交易逻辑来适应多变的市场状态[124]。 * **模型具体构建过程**:引入时序与空间注意力机制刻画资产的时空相关性,并利用混合专家结构在不同市场状态下动态切换交易逻辑[124]。 模型的回测效果 (注:报告中对部分模型给出了具体的策略跟踪结果,但指标名称和取值在提供的文本中未完整、系统地列出。以下根据原文提及的绩效描述进行总结。) 1. **AI全频段量价模型**:自2017年以来年化超额收益显著,在样本外持续展现出对中证1000指数的稳健增强效果[6]。 2. **Master因子**:通过精细化的结构设计与风格控制,既可兼顾Pure Alpha,也有机会捕获风格收益[6]。 3. **PortfolioNet 2.0因子**:在回测区间(2023-01-03至2025-11-28)内,合成因子相比于经典AI量价模型取得明显提升,在300增强、500增强与1000增强场景下,年化超额收益分别提升7.5pct、7.5pct与8.5pct,信息比率(IR)同步改善[113]。 4. **舆情分诊台(LLMRouter-GRU)**:在文本另类数据相关策略中表现优异[6]。 5. **LLM-FADT文本策略**:在文本另类数据相关策略中表现优异[6]。 量化因子与构建方式 1. **因子名称:Master因子** * **因子构建思路**:通过精细化的模型结构设计与风格控制,构建既能捕捉Pure Alpha,又能兼顾风格收益的复合因子[6]。 * **因子具体构建过程**:基于Master模型(一种市场引导的股票Transformer)进行股价预测,生成的预测信号作为选股因子[86]。具体构建方法可参考图表51[12]。 2. **因子名称:PortfolioNet2.0因子** * **因子构建思路**:利用PortfolioNet 2.0模型,通过端到端学习从原始数据中合成兼取风格收益与Pure Alpha的因子[6][113]。 * **因子具体构建过程**:模型在训练过程中,通过可微的组合约束项,使学习到的信号同时蕴含Pure Alpha和风格收益信息,最终输出用于选股的合成因子[113]。 3. **因子名称:大模型舆情选股因子 / LLM-FADT因子** * **因子构建思路**:利用大语言模型对文本(如分析师研报、新闻)的深度理解能力,挖掘其中的情绪或事件信息,并将其量化为选股因子[6][51]。 * **因子具体构建过程**:通过大模型处理文本数据,进行情感分类、信息提取或逻辑推理,将结果转化为数值型的股票信号[51][61]。 4. **因子名称:AI宏观因子** * **因子构建思路**:借助大语言模型从海量新闻舆情中提炼宏观叙事与情绪,构建能够捕捉传统数据滞后市场规律的宏观因子[5][132]。 * **因子具体构建过程**:使用LLM处理宏观新闻文本,构建例如经济增长、地缘风险等情绪指数,形成可用于资产配置或策略的宏观因子[53][132]。 5. **因子/框架名称:风险因子挖掘框架(如HRFT)** * **因子构建思路**:专注于挖掘刻画市场不确定性(如波动、相关性、尾部风险)的风险因子,而非传统收益因子[93]。 * **因子具体构建过程**:以HRFT(High-Frequency Risk Factor Transformer)为例,作为一种端到端挖掘框架,将符号数学类比为语言,利用Transformer直接从高频交易特征中自动提取可解释的公式化风险因子,例如用于度量短期市场收益分布方差的因子[93]。 6. **因子挖掘框架:EvoAlpha / TreEvo / CogAlpha** * **构建思路**:基于大语言模型实现“认知型”因子挖掘,利用LLM对金融语义和代码逻辑的理解来指导进化过程,提升搜索效率和因子的可解释性[96][97]。 * **具体构建过程**:如TreEvo框架引入“树状思维进化”,让LLM先构建分层的交易逻辑(如动量、反转的组合),再将其转化为具体代码,实现从线性代码生成向层次化思维进化的转变[97]。 7. **因子挖掘框架:Alpha Jungle / RiskMiner** * **构建思路**:将LLM的生成能力与蒙特卡洛树搜索(MCTS)等规划算法结合,在高维稀疏的Alpha空间中实现有导向、有策略的高效导航[100][101]。 * **具体构建过程**:LLM作为策略网络提出候选公式,回测结果作为价值网络的反馈信号,引导MCTS的搜索方向。RiskMiner则采用“风险寻求”的MCTS变体,专门探索高风险但潜在高收益的稀有因子[101]。 8. **因子挖掘框架:AlphaForge / Synergistic Alpha** * **构建思路**:重心从挖掘单一因子转向“因子协同”与“动态组合”,直接面向投资组合的最终表现进行端到端优化[105]。 * **具体构建过程**:不仅挖掘基础公式,还通过基因拼接等算子寻找与现有因子库正交的新因子,并引入动态权重调整机制,实现基于市场环境变化的实时因子重组[105]。 因子的回测效果 (注:报告中对部分因子给出了具体的绩效指标,以下根据原文图表和描述进行总结。) 1. **Master因子**:根据图表52,在回测中展示了其RankIC、年化超额收益、夏普比率等信息,并与其他基准因子进行了对比[12]。图表55和56显示了其用于中证1000指数增强的业绩指标和超额净值曲线[12]。 2. **PortfolioNet2.0因子**:根据图表59,在中证1000指增组合中(回测区间2023-01-03至2025-12-31),展示了年化超额收益、超额波动、信息比率(IR)、最大回撤等绩效指标[12]。 3. **“舆情分诊台”AI量价因子**:根据图表57,在沪深300指增组合中(回测区间2023-01-03至2025-12-31),展示了年化超额收益、信息比率(IR)等绩效表现[12]。 4. **LLM-FADT文本策略**:根据图表63,在中证500增强策略回测期(2017-01-26至2025-12-31)内,展示了年化收益、年化波动、夏普比率、最大回撤等绩效指标[12]。图表65对比了其与BERT-FADT策略的超额收益[12]。