细分特殊化Beta
搜索文档
主观投资框架验证与个股决策Agent
国金证券· 2026-03-11 13:27
量化模型与构建方式 1. **模型名称:优质CoT联合投票策略** [4] * **模型构建思路**:基于从研报中动态提取并验证有效的“投资思维链”,构建多专家投票机制。每条有效的思维链被视为一个“投资专家”,各自对个股进行判断,通过汇总投票结果来筛选最终持仓股票[4][37]。 * **模型具体构建过程**: 1. **思维链提取与验证**:使用大模型从历史研报中提取“驱动因素→推理链条→投资结论”的完整思维链,并进行滚动回测,筛选出信息比率(IR)表现最优的前1/3(最多约7条)作为当期“优质思维链”[4][24][33][34]。 2. **个股符合度判断**:每条优质思维链根据当前截面的个股信息(研报+实时新闻),判断其与自身逻辑的“符合程度”(不符合/较符合/完全符合)并给出置信度打分[4][33][41]。 3. **投票与持仓构建**:每条思维链判断为“完全符合”的个股记为一票。每月初,汇总所有优质思维链的投票,将获得至少3票的股票纳入持仓。若当月无符合持仓条件的股票,则维持上期持仓不变[4][46]。 2. **模型名称:优质CoT加权选股策略** [4] * **模型构建思路**:在联合投票策略的基础上进行优化,根据每条优质思维链的历史表现(信息比率)赋予其不同的权重,表现越好的思维链,其选中的股票得分越高,以此提升策略的风险控制能力[4][58]。 * **模型具体构建过程**: 1. **优质思维链筛选**:与投票策略相同,筛选出信息比率表现最优的前1/3思维链[4][58]。 2. **权重赋值**:根据每条思维链在检验期间的信息比率分位数构建权重,表现越优异,权重越高[58]。 3. **个股得分计算**:每条优质思维链对其判断为“完全符合”的个股,赋予该链对应的权重分数。每月初,汇总每只股票获得的所有权重分数,得到累计得分[58]。 4. **持仓构建**:将累计得分高于设定阈值(报告中为3.5分)的股票纳入持仓。若当月无股票得分超过阈值,则维持上期持仓不变[58]。 模型的回测效果 *测试基准:分析师等权基准,回测区间:2021年1月-2026年1月,费率:千分之三[4][46]* 1. **优质CoT联合投票策略**,年化超额收益率17.16%,年化波动率35.87%,最大回撤43.99%,信息比率(IR)0.48[4][57]。 2. **优质CoT加权选股策略**,年化超额收益率16.21%,年化波动率31.94%,最大回撤44.17%,信息比率(IR)0.51[4][61]。 量化因子与构建方式 *注:本报告的核心是构建基于“思维链”的选股模型,并未构建传统的量化因子。报告将每条“投资思维链”本身视为一种动态的、非结构化的选股逻辑单元,并通过模型化的方式(投票、加权)进行应用。因此,以下总结的是构成模型的底层“思维链”的构建与验证过程。* 1. **因子/逻辑单元名称:主观投资思维链(CoT)** [3][19] * **构建思路**:利用大语言模型(LLM)的思维链(Chain of Thought, CoT)技术,从海量的非结构化卖方研报文本中,自动化提取分析师完整的投资推理逻辑,形成“核心驱动要素→传导路径→投资结论”的逻辑链条[2][3][19]。 * **具体构建过程**: 1. **数据准备与筛选**:收集特定行业(如医药生物)的卖方研报,通过研报筛选器进行行业分类和质量加权(如研报长度、分析师权威性)[24]。 2. **思维链生成**:设计提示词引导大模型(如DeepSeek-R1)阅读研报,要求其识别核心驱动因素(trigger),推导出从驱动因素到投资结论的严密传导路径(CoT),并给出信号强度(signal)打分,生成不少于15条投资推理链条[24][26][29]。 3. **时序处理与更新**:以半年为频率,对思维链组进行合并、补缺和迭代更新。确保每个时间截面的思维链组仅包含该时点及之前的所有信息,避免未来信息泄露,并根据新信息对旧逻辑的信号强度进行自适应衰减[24][26]。 * **因子评价**:该方法能够穿透文本,提取复杂的因果推演逻辑,将非结构化的主观投资框架转化为可量化、可验证的策略信号[2][13][68]。 2. **因子/逻辑单元验证机制:滚动单链回测** [3][33] * **构建思路**:对提取出的每一条投资思维链进行独立的历史回测,定量验证其在不同市场环境下的选股有效性,并动态筛选出当前有效的“优质思维链”[3][33]。 * **具体构建过程**: 1. **信息输入**:对于每个回测截面,为每只个股汇总该时间点的研报信息和实时新闻数据[33]。 2. **符合度判断**:每条思维链基于汇总信息,判断每只个股是否符合自身逻辑,给出“不符合/较符合/完全符合”的定性判断及0%-100%的置信度打分[33][34]。 3. **持仓与绩效计算**:根据阈值(如只持仓“完全符合”的个股)构建该思维链的模拟持仓组合(0-12只),计算其相对于行业基准(如医药全指)的年化超额收益率、跟踪误差和信息比率(IR)[34]。 4. **动态筛选**:根据回测结果(主要是信息比率IR),在每个周期(如半年)筛选出表现最优的思维链组,用于下一周期的选股策略[4][45]。 因子的回测效果 *测试基准:医药全指,测试结果为2025H2截面示例[35]* 1. **新产品研发与商业化进展思维链**,年化超额收益率26.32%,跟踪误差14.33%,信息比率(IR)1.84[35]。 2. **产品结构优化与高端转型思维链**,年化超额收益率22.26%,跟踪误差18.07%,信息比率(IR)1.23[35]。 3. **刚性需求增长与基本面稳固思维链**,年化超额收益率9.78%,跟踪误差11.07%,信息比率(IR)0.88[35]。 4. **产能建设与供应链强化思维链**,年化超额收益率9.35%,跟踪误差20.04%,信息比率(IR)0.47[35]。 5. **销售渠道深化与市场渗透率提升思维链**,年化超额收益率8.40%,跟踪误差18.44%,信息比率(IR)0.46[35]。 *(注:报告中列出了共17条思维链的回测结果,此处仅列举IR较高的前5条作为示例)*