报告核心观点 - 发挥大模型优势探索情绪、政策变量构建,用腾讯元宝搭载的DeepSeek - R1大模型从互联网公开信息推理A股市场或特定板块“情绪”,观察其构建的情绪观点与传统量化指标的优劣[1][8] - 利用Prompt工程得到大模型“分析师”的A股情绪观点,将其与传统情绪指标合成综合情绪指标,不损失原策略超额收益且有收益加成[1] - 以光伏行业为例,大模型构建的景气度指标对光伏行业择时效果整体优于原光伏政策景气度指标,但2024年开始平台搜索结果有限、模型结果波动较低[1] - 大模型在文本分析与情感判断领域有优势,但存在信息来源有限、可能引用非权威信息、产生“幻觉”等问题,需调整Prompt、接入专业信息资料等改进[1] 分组1:发挥大模型优势探索情绪、政策变量构建 - 大语言模型新时代,腾讯元宝等平台接入DeepSeek大模型,结合自身优势解决运算和存储问题[7] - 生成式AI在文字理解和学习能力上有优势,可在传统量化难处理的情绪、政策方向判断上提供帮助[8] 分组2:利用Prompt工程得到大模型“分析师”的A股情绪观点 大模型交互第一步——Prompt设计 - Prompt由任务说明、上下文、问题、输出格式四个基本元素组成,其设计对模型性能影响深远[10][13] - 任务说明明确大模型为A股策略分析师,从2025年1月政策、事件判断A股后市多空观点[14] - 上下文划分历史多空阶段,梳理政策和时间背景,喂给大模型不同示例,助其理解多空判断参考信息[15] - 任务补充信息规范信息源、前向数据隔离原则等[19] - 输出格式要求以JSON格式返回最终多空结果及不超500字的推理依据[21] 模型结果及运用 - 多次测试表明DeepSeek - R1具备稳定结构输出且逻辑自洽,2024年1月至2025年3月仅2024年2月提示看空,其余月份看多[33] - 大模型从政策、事件角度的多空观点与基于价量等构建的情绪结构指标提示观点有分歧,但可结合使用[41] - 将大模型观点加入市场情绪模型,不损失原策略超额收益且有收益加成[48] 大模型应用平台在专业领域下的“信息茧房”困境 - 存在数据缺陷,推理效果受第三方平台网页内容权限影响大,且无法判断信息贡献权重[51] - 存在信息偏见,大模型结论与量化指标和实际股市涨跌有分歧,新闻资讯非优质信息来源[57] - 大模型有“讨好型人格”,会产生幻觉,但严格的Prompt工程设计可降低其概率[59] 分组3:大模型如何应用于行业景气研究——以光伏行业为例 基于热词词频计算的光伏政策景气度 - 对索比光伏网公开新闻标签词统计,按规则打分加总形成月度得分时间序列,量化光伏政策新闻热度[61][64] 大模型基于行业资讯文本的景气度结果 - 利用大模型挑选“热词”并贴“利好”“利空”标签,生成情绪词典,量化行业政策景气度[67] - 改写Prompt工程,让大模型按月统计“看多”“看空”词语及短句数量,计算景气值[70][74] - 测试发现模型联网搜索资料数量不因统计时点增多而增加,样本外问答每次提问一个月更合理,且多次问答需耗费时间成本[80][81]
AI辅助投研深度案例系列之二:大模型赋能情绪、政策指标构建
申万宏源证券·2025-04-07 19:43