量化模型与构建方式 1. 模型名称:三角验证体系 - 模型构建思路:通过思维链推理(COT)、对比分析和反事实推理三种方法,形成多维度验证闭环,提升模型的逻辑一致性和事实准确性[23][24][71] - 模型具体构建过程: 1. 思维链推理(COT):逐步分解问题,显式化模型决策路径,确保逻辑链条的严密性。例如,从"锂价下跌→成本改善→毛利率提升"的因果链中定位逻辑断裂点[24][72][73] 2. 对比分析:横向对比同行数据(如毛利率变动差异),纵向回溯历史规律(如技术突破对净利润的边际影响),验证预测的合理性[24][77][81] 3. 反事实推理:假设条件变化(如延迟量产),评估结论的敏感性和稳健性,识别潜在风险[24][83][84] - 模型评价:三角验证体系显著优化了模型输出的稳定性,修正了单纯COT的评分偏差,提升了逻辑透明度和预测准确性[24][144][145] 2. 模型名称:StockGPT - 模型构建思路:通过LoRA微调技术,将基本面文本数据与市场时序数据(OHLC)联合建模,增强模型对行情数据与收益率关系的理解[118][125][145] - 模型具体构建过程: 1. 数据准备: - 基本面文本数据:通过三角验证体系提取关键信号[125][126] - 时序数据:提取前15个交易日的OHLC数据,归一化处理后生成时间序列Token[125][126] 2. LoRA微调: - 引入低秩矩阵A和B,将原始权重矩阵W分解为,仅优化A和B,冻结W[119][120][121] - 参数设置:学习率乘数为1,批量大小为32,训练轮数为5,最大序列长度为8192,LoRA秩为16[130] 3. 模型训练:基于2014-2018年的历史数据进行训练,以次月收益组别(0-10)作为标签[129][130] - 模型评价:StockGPT在捕捉复杂市场关系方面表现出一定潜力,但仍受限于数据噪声和金融因果链复杂性[145][146] --- 模型的回测效果 1. 三角验证体系 - 年化收益:17.2% - 超额收益:较基准指数超额收益12.56% - 风格暴露:显著偏向成长与流动性驱动[144][145] 2. StockGPT - 年化收益:18.8% - 超额收益:较中证800超额收益18.31% - 信息比率(IR):2.18 - 最大回撤:-19.47% - 风格暴露:偏向中小市值、高流动性资产,规避低估值、高杠杆股票[137][138][139] --- 量化因子与构建方式 1. 因子名称:一致预测因子 - 因子构建思路:基于分析师一致预测数据,提取盈利预测变化、目标价变化等特征[29][30] - 因子具体构建过程: 1. 收集分析师一致预测数据(如EPS、NP、REV等) 2. 计算当前预测值与1个月前、3个月前预测值的变化率 3. 提取目标价变化、评级上调等特征[30] - 因子评价:一致预测因子在选股中表现出较高的胜率和信息比率,但部分因子(如净利润增速)表现较弱[30] 2. 因子名称:基于LLM的研报文本因子 - 因子构建思路:利用大语言模型(LLM)对研报文本进行分析,提取隐含的投资逻辑和观点[33][39] - 因子具体构建过程: 1. 使用LLM对研报文本进行分步推理,提取长期逻辑、中期信号和短期驱动[33][44] 2. 基于提取的逻辑链条,生成选股因子[33][39] - 因子评价:LLM因子具有一定的选股效果,但预测收益率分布较为集中,信息整合依赖性强[39][40][43] --- 因子的回测效果 1. 一致预测因子 - Rank IC:1.20%-3.47% - IR:0.87-1.59 - 胜率:0.49-0.71[30] 2. 基于LLM的研报文本因子 - 年化收益:9.2% - 超额收益:相对于中证全指超额收益7% - 分布特性:预测收益率集中在5%-10%之间[39][40]
量化专题报告:研报+公告+调研+量价全数据智能投研AI构建
民生证券·2025-02-18 20:23