超越GPT-5、Gemini Deep Research!人大高瓴AI金融分析师,查数据、画图表、写研报样样精通
量子位·2025-12-26 14:35

玉兰·融观 (FinSight) 系统概述 - 中国人民大学高瓴人工智能学院推出了面向真实金融投研场景的多模态研报生成系统“玉兰·融观 (Yulan-FinSight)” [1] - 该系统能够自动拆解研究任务,从互联网和金融数据库搜集多源异构数据,并生成包含“发展历程”、“核心业务架构”、“竞争格局”等章节的万字图文报告 [3] - 该系统在AFAC 2025金融智能创新大赛挑战组的1289支队伍中夺冠,并在多项评测中超越了GPT-5 w/Search、OpenAI Deep Research与Gemini-2.5-Pro Deep Research [3] 通用AI在金融研报领域的挑战 - 金融研究报告是一项高度结构化、强逻辑、强可视化的专家级工作,对数据整合能力、分析深度及表达形式要求极高 [5][6] - 挑战一:领域知识与数据割裂。通用系统难以有效整合股价、财报等结构化数据与新闻、公告等非结构化信息,缺乏统一数据表示与多智能体协作分析机制 [7] - 挑战二:专业级可视化能力缺失。现有模型难以支持多维对比、事件标注等专业金融图表需求,且图文之间常缺乏严格的数据一致性约束 [8] - 挑战三:缺乏“迭代式研究”能力。现有系统多采用固定的“先检索—后生成”流程,难以像人类分析师一样根据中间发现动态调整研究重点 [9] FinSight的核心技术创新 - 核心思路是模拟人类金融专家的工作方式,而非简单堆叠模型 [10] - 创新一:采用代码驱动的可变内存智能体架构。该系统将数据、工具与中间推理结果统一映射为可读写的程序变量,由多个代码智能体通过共享变量空间协同推理,以支持长时程、多流程的专家级任务 [11][14][16] - 创新二:提出迭代式视觉增强机制。采用Actor–Critic协作范式,文本大模型生成绘图代码,视觉语言模型提供视觉反馈,通过多轮“生成—评估—修正”闭环优化,提升图表专业性 [18][20][21] - 创新三:采用两阶段写作框架。第一阶段生成针对子任务的分析链,第二阶段以分析链为骨架,组织编排生成长篇报告,有效避免逻辑松散问题 [24][25][26][27] - 在写作阶段引入生成式检索机制,模型根据上下文动态生成数据和图片索引标识符,以保障引用准确性和图文一致性 [29][30] 系统性能与实验结果 - 在高质量基准测试中,FinSight在事实准确性、分析深度与呈现质量三项核心指标上均显著优于对比系统,综合评分达到8.09 [34] - 在可视化维度上,得益于迭代式视觉增强机制,FinSight获得9.00的评分,明显领先 [35] - 系统生成的研报平均长度超过20000字,包含50余张图表与结构化数据引用,且报告质量随篇幅增长保持稳定 [38] - 在AFAC 2025金融智能创新大赛中,FinSight在1289支参赛队伍中排名第一,验证了其在真实场景中的实用性与鲁棒性 [39] 系统意义与行业影响 - FinSight展示了智能体架构在高复杂度垂直领域的潜力,首次在金融投研这一“专家密集型”场景中,展现出接近人类分析师的工作能力 [40] - 这一范式表明,在高度依赖专业知识、长时程推理与多模态表达的领域,AI系统开始承担起类似人类专家的工作方式 [41] - 随着智能体架构成熟,未来的科研分析、法律研判、医疗决策等复杂领域,或将逐步迎来以专家级AI智能体为核心的新一代生产力形态 [42][43]