量化模型与构建方式 1. 模型名称:DeepSeek-V3行业研报总结模型 模型构建思路:利用大模型的自然语言处理能力,对行业研报摘要进行智能总结,提炼核心观点和关键信息[7] 模型具体构建过程: - 从Wind数据库获取行业研报,筛选入库时间范围内的报告(如2025年3月10日至16日)[7] - 将同一一级行业的所有摘要合并,与标准化提示词拼接后输入模型[7] - 提示词要求总结不超过200字,需准确反映研报事实、观点和结论,避免风险提示和个人意见[8] - 模型输出结果按行业分类展示(如表1至表4)[9][10][11][12] 2. 模型名称:DeepSeek-V3行业景气度评分模型 模型构建思路:通过大模型量化分析行业研报中的景气度和超预期程度,解决传统行业评级离散化问题[15] 模型具体构建过程: - 构造标准化提示词,明确要求输出两个JSON格式结果: - 第一个JSON包含研报涉及的一级/二级行业名称[17] - 第二个JSON包含对应行业的景气度(1-10分)和超预期程度评分(1-10分)[17] - 定义评分标准: - 景气度:行业盈利水平及增长潜力[17] - 超预期程度:实际表现与市场预期的差异[17] - 模型输入为研报摘要与提示词拼接文本,输出结构化评分数据(如图2示例)[17] --- 量化因子与构建方式 1. 因子名称:行业景气度因子 因子构建思路:基于大模型对研报文本的解读,生成连续型行业景气度评分[15][17] 因子具体构建过程: - 从研报摘要提取行业名称(中信一级/二级分类)[17] - 通过提示词定义评分规则,要求模型输出1-10分的景气度数值[17] - 计算公式: 其中为覆盖该行业的研报数量[19] 2. 因子名称:行业超预期程度因子 因子构建思路:量化行业实际表现与市场预期的偏离程度[15][17] 因子具体构建过程: - 模型根据文本分析判断行业是否超预期,输出1-10分评分[17] - 计算行业均值: 同步计算周环比变化值[19] --- 模型的回测效果 1. DeepSeek-V3行业研报总结模型: - 覆盖751篇初始报告,经筛选后处理682篇有效样本[19] - 输出结果按中信二级行业分类展示(如石油石化、煤炭等)[9][10][11][12] 2. DeepSeek-V3行业景气度评分模型: - 生成标准化JSON格式输出,包含行业名称与评分[17] - 支持跨证券公司行业分类不一致问题的解决方案[15] --- 因子的回测效果 1. 行业景气度因子: - 航空航天行业景气度最高(9.13分),渔业最低(6.00分)[20][21] - 周变化显示通信设备行业景气度提升最显著(+0.72)[20] 2. 行业超预期程度因子: - 航空航天超预期程度8.13分,通信设备7.88分[20] - 互联网媒体行业超预期周变化最大(+0.61)[20] (注:表5和表6完整数据见文档[20][21],包含44个中信二级行业的因子取值及周变化)
大模型总结和解读行业研报
天风证券·2025-03-17 10:46