根据提供的研报内容,以下是量化模型与因子的详细总结: 量化模型与构建方式 1. 模型名称:DeepSeek-V3-0324大模型 - 模型构建思路:利用大模型的自然语言处理能力,对行业研报进行智能总结和整合,提炼核心观点与关键信息,以解决人工阅读成本高的问题[5][6] - 模型具体构建过程: 1. 从Wind数据库获取行业研报(样本量756篇),过滤后保留672篇[2][18] 2. 将同一行业的所有摘要合并,拼接标准化提示词后输入模型[5][15] 3. 提示词要求模型生成不超过200字的摘要,需准确反映研报事实与结论,避免风险提示和个人意见[6] 4. 模型输出行业名称、景气度及超预期程度的标准化JSON格式结果[15][16] - 模型评价:能够高效处理海量文本,但存在信息二次加工导致失真的风险[6] 2. 模型名称:行业景气度量化模型 - 模型构建思路:通过大模型提取研报中的行业景气度与超预期程度,解决传统行业评级离散化、分类标准不统一的问题[12][13] - 模型具体构建过程: 1. 定义景气度为行业基本面改善程度,超预期程度为分析师预测与实际表现的差异[15] 2. 使用DeepSeek-V3对每篇研报标注中信一级/二级行业,并输出0-10分的景气度与超预期评分[18][19] 3. 按二级行业计算均值,保留报告数>2的行业[18] 4. 计算周环比变化值(如通信设备景气度8.88,周变化+0.54)[19][21] 模型的回测效果 1. DeepSeek-V3模型: - 覆盖32个中信二级行业,总结结果示例见石油石化、煤炭等行业摘要[6][7][8] 2. 行业景气度模型: - 通信设备:景气度8.88(IR 0.54),超预期程度8.00(IR 0.67)[19] - 航空航天:景气度8.83(IR 0.13),超预期程度8.17(IR 0.47)[19] - 计算机软件:景气度8.83(IR 0.21),超预期程度7.83(IR 0.21)[19] - 普钢:景气度5.00(IR -1.29),超预期程度4.00(IR -1.29)[21] 量化因子与构建方式 1. 因子名称:行业景气度因子 - 因子构建思路:反映行业基本面改善程度的连续型指标[12][15] - 因子具体构建过程: - 从研报文本中提取景气度评分,范围0-10分,分数越高表示行业越景气[15][19] - 计算公式: 其中为属于行业的研报数量[18] 2. 因子名称:超预期程度因子 - 因子构建思路:衡量行业实际表现超出分析师预期的程度[15][18] - 因子具体构建过程: - 类似景气度因子,通过大模型对每篇研报标注0-10分的超预期评分[15][19] - 计算公式同景气度因子,但替换为超预期评分[18] 因子的回测效果 1. 行业景气度因子: - 通信设备:8.88[19] - 渔业:5.50[21] 2. 超预期程度因子: - 通信设备:8.00[19] - 品牌服饰:6.00[21] 注:所有指标均基于2025年3月24-30日数据计算,IR值为周环比变化[19][21]
DeepSeek-V3-0324大模型总结和解读近期行业研报
天风证券·2025-03-31 11:16