细分特殊化Beta - 财报，业绩电话会，研报，新闻

细分特殊化Beta

搜索文档

国金证券· 2026-03-11 13:27

量化模型与构建方式 1. **模型名称：优质CoT联合投票策略** [4] * **模型构建思路**：基于从研报中动态提取并验证有效的“投资思维链”，构建多专家投票机制。每条有效的思维链被视为一个“投资专家”，各自对个股进行判断，通过汇总投票结果来筛选最终持仓股票[4][37]。 * **模型具体构建过程**： 1. **思维链提取与验证**：使用大模型从历史研报中提取“驱动因素→推理链条→投资结论”的完整思维链，并进行滚动回测，筛选出信息比率（IR）表现最优的前1/3（最多约7条）作为当期“优质思维链”[4][24][33][34]。 2. **个股符合度判断**：每条优质思维链根据当前截面的个股信息（研报+实时新闻），判断其与自身逻辑的“符合程度”（不符合/较符合/完全符合）并给出置信度打分[4][33][41]。 3. **投票与持仓构建**：每条思维链判断为“完全符合”的个股记为一票。每月初，汇总所有优质思维链的投票，将获得至少3票的股票纳入持仓。若当月无符合持仓条件的股票，则维持上期持仓不变[4][46]。 2. **模型名称：优质CoT加权选股策略** [4] * **模型构建思路**：在联合投票策略的基础上进行优化，根据每条优质思维链的历史表现（信息比率）赋予其不同的权重，表现越好的思维链，其选中的股票得分越高，以此提升策略的风险控制能力[4][58]。 * **模型具体构建过程**： 1. **优质思维链筛选**：与投票策略相同，筛选出信息比率表现最优的前1/3思维链[4][58]。 2. **权重赋值**：根据每条思维链在检验期间的信息比率分位数构建权重，表现越优异，权重越高[58]。 3. **个股得分计算**：每条优质思维链对其判断为“完全符合”的个股，赋予该链对应的权重分数。每月初，汇总每只股票获得的所有权重分数，得到累计得分[58]。 4. **持仓构建**：将累计得分高于设定阈值（报告中为3.5分）的股票纳入持仓。若当月无股票得分超过阈值，则维持上期持仓不变[58]。模型的回测效果 *测试基准：分析师等权基准，回测区间：2021年1月-2026年1月，费率：千分之三[4][46]* 1. **优质CoT联合投票策略**，年化超额收益率17.16%，年化波动率35.87%，最大回撤43.99%，信息比率（IR）0.48[4][57]。 2. **优质CoT加权选股策略**，年化超额收益率16.21%，年化波动率31.94%，最大回撤44.17%，信息比率（IR）0.51[4][61]。量化因子与构建方式 *注：本报告的核心是构建基于“思维链”的选股模型，并未构建传统的量化因子。报告将每条“投资思维链”本身视为一种动态的、非结构化的选股逻辑单元，并通过模型化的方式（投票、加权）进行应用。因此，以下总结的是构成模型的底层“思维链”的构建与验证过程。* 1. **因子/逻辑单元名称：主观投资思维链（CoT）** [3][19] * **构建思路**：利用大语言模型（LLM）的思维链（Chain of Thought, CoT）技术，从海量的非结构化卖方研报文本中，自动化提取分析师完整的投资推理逻辑，形成“核心驱动要素→传导路径→投资结论”的逻辑链条[2][3][19]。 * **具体构建过程**： 1. **数据准备与筛选**：收集特定行业（如医药生物）的卖方研报，通过研报筛选器进行行业分类和质量加权（如研报长度、分析师权威性）[24]。 2. **思维链生成**：设计提示词引导大模型（如DeepSeek-R1）阅读研报，要求其识别核心驱动因素（trigger），推导出从驱动因素到投资结论的严密传导路径（CoT），并给出信号强度（signal）打分，生成不少于15条投资推理链条[24][26][29]。 3. **时序处理与更新**：以半年为频率，对思维链组进行合并、补缺和迭代更新。确保每个时间截面的思维链组仅包含该时点及之前的所有信息，避免未来信息泄露，并根据新信息对旧逻辑的信号强度进行自适应衰减[24][26]。 * **因子评价**：该方法能够穿透文本，提取复杂的因果推演逻辑，将非结构化的主观投资框架转化为可量化、可验证的策略信号[2][13][68]。 2. **因子/逻辑单元验证机制：滚动单链回测** [3][33] * **构建思路**：对提取出的每一条投资思维链进行独立的历史回测，定量验证其在不同市场环境下的选股有效性，并动态筛选出当前有效的“优质思维链”[3][33]。 * **具体构建过程**： 1. **信息输入**：对于每个回测截面，为每只个股汇总该时间点的研报信息和实时新闻数据[33]。 2. **符合度判断**：每条思维链基于汇总信息，判断每只个股是否符合自身逻辑，给出“不符合/较符合/完全符合”的定性判断及0%-100%的置信度打分[33][34]。 3. **持仓与绩效计算**：根据阈值（如只持仓“完全符合”的个股）构建该思维链的模拟持仓组合（0-12只），计算其相对于行业基准（如医药全指）的年化超额收益率、跟踪误差和信息比率（IR）[34]。 4. **动态筛选**：根据回测结果（主要是信息比率IR），在每个周期（如半年）筛选出表现最优的思维链组，用于下一周期的选股策略[4][45]。因子的回测效果 *测试基准：医药全指，测试结果为2025H2截面示例[35]* 1. **新产品研发与商业化进展思维链**，年化超额收益率26.32%，跟踪误差14.33%，信息比率（IR）1.84[35]。 2. **产品结构优化与高端转型思维链**，年化超额收益率22.26%，跟踪误差18.07%，信息比率（IR）1.23[35]。 3. **刚性需求增长与基本面稳固思维链**，年化超额收益率9.78%，跟踪误差11.07%，信息比率（IR）0.88[35]。 4. **产能建设与供应链强化思维链**，年化超额收益率9.35%，跟踪误差20.04%，信息比率（IR）0.47[35]。 5. **销售渠道深化与市场渗透率提升思维链**，年化超额收益率8.40%，跟踪误差18.44%，信息比率（IR）0.46[35]。 *（注：报告中列出了共17条思维链的回测结果，此处仅列举IR较高的前5条作为示例）*