Workflow
金融工程:大模型总结和解读行业研报
天风证券·2025-02-05 16:23

量化模型与构建方式 1. 模型名称:DeepSeek-V3 - 模型构建思路:利用大模型的自然语言处理能力,对行业研报进行智能总结和整合,提炼核心观点和关键信息[2][8] - 模型具体构建过程: 1. 从Wind数据库获取行业研报数据,筛选出符合条件的报告作为样本[8][22] 2. 将同一一级行业内的所有摘要合并,并与特定提示词拼接后输入DeepSeek-V3模型[8][17] 3. 模型输出包括行业名称、景气度、超预期程度等指标,结果以标准化JSON格式返回[17][20] 4. 为保证结果一致性,模型随机性参数设置为0[8][22] - 模型评价:DeepSeek-V3在处理长文本和客观信息方面表现优异,能够有效提取行业研报中的关键信息,提升了行业比较的可操作性[3][17] --- 模型的回测效果 1. DeepSeek-V3模型 - 景气度:通信设备(9.00)、互联网媒体(9.00)、专用机械(8.83)、计算机软件(8.80)等行业景气度较高[23][24] - 超预期程度:通信设备(8.67)、互联网媒体(8.00)、专用机械(7.83)、计算机软件(7.88)等行业超预期程度较高[23][24] - 报告数目:通信设备(3)、互联网媒体(6)、专用机械(6)、计算机软件(25)[23][24] - 景气度周变化:通信设备(+0.18)、互联网媒体(+0.46)、专用机械(+0.40)、计算机软件(+0.24)[23][24] - 超预期程度周变化:通信设备(+0.94)、互联网媒体(+0.32)、专用机械(+0.40)、计算机软件(+0.36)[23][24] --- 量化因子与构建方式 1. 因子名称:景气度因子 - 因子的构建思路:通过对行业研报的文本分析,提取行业景气度信息,量化行业的整体表现[17][22] - 因子具体构建过程: 1. 使用DeepSeek-V3模型对研报摘要进行解析,提取行业相关的景气度信息[22][23] 2. 按照中信二级行业分类,计算每个行业的景气度均值[22][23] 3. 仅保留报告数目大于2的行业,确保数据的代表性[22][23] 2. 因子名称:超预期程度因子 - 因子的构建思路:通过分析行业研报中对行业表现的描述,量化行业的超预期表现程度[17][22] - 因子具体构建过程: 1. 使用DeepSeek-V3模型解析研报摘要,提取超预期程度信息[22][23] 2. 按中信二级行业分类,计算超预期程度的均值[22][23] 3. 同样仅保留报告数目大于2的行业[22][23] --- 因子的回测效果 1. 景气度因子 - 景气度:通信设备(9.00)、互联网媒体(9.00)、专用机械(8.83)、计算机软件(8.80)[23][24] - 景气度周变化:通信设备(+0.18)、互联网媒体(+0.46)、专用机械(+0.40)、计算机软件(+0.24)[23][24] 2. 超预期程度因子 - 超预期程度:通信设备(8.67)、互联网媒体(8.00)、专用机械(7.83)、计算机软件(7.88)[23][24] - 超预期程度周变化:通信设备(+0.94)、互联网媒体(+0.32)、专用机械(+0.40)、计算机软件(+0.36)[23][24]