Agent架构
搜索文档
超越GPT-5、Gemini Deep Research!人大高瓴AI金融分析师,查数据、画图表、写研报样样精通
量子位· 2025-12-26 14:35
玉兰·融观 (FinSight) 系统概述 - 中国人民大学高瓴人工智能学院推出了面向真实金融投研场景的多模态研报生成系统“玉兰·融观 (Yulan-FinSight)” [1] - 该系统能够自动拆解研究任务,从互联网和金融数据库搜集多源异构数据,并生成包含“发展历程”、“核心业务架构”、“竞争格局”等章节的万字图文报告 [3] - 该系统在AFAC 2025金融智能创新大赛挑战组的1289支队伍中夺冠,并在多项评测中超越了GPT-5 w/Search、OpenAI Deep Research与Gemini-2.5-Pro Deep Research [3] 通用AI在金融研报领域的挑战 - 金融研究报告是一项高度结构化、强逻辑、强可视化的专家级工作,对数据整合能力、分析深度及表达形式要求极高 [5][6] - 挑战一:领域知识与数据割裂。通用系统难以有效整合股价、财报等结构化数据与新闻、公告等非结构化信息,缺乏统一数据表示与多智能体协作分析机制 [7] - 挑战二:专业级可视化能力缺失。现有模型难以支持多维对比、事件标注等专业金融图表需求,且图文之间常缺乏严格的数据一致性约束 [8] - 挑战三:缺乏“迭代式研究”能力。现有系统多采用固定的“先检索—后生成”流程,难以像人类分析师一样根据中间发现动态调整研究重点 [9] FinSight的核心技术创新 - 核心思路是模拟人类金融专家的工作方式,而非简单堆叠模型 [10] - 创新一:采用代码驱动的可变内存智能体架构。该系统将数据、工具与中间推理结果统一映射为可读写的程序变量,由多个代码智能体通过共享变量空间协同推理,以支持长时程、多流程的专家级任务 [11][14][16] - 创新二:提出迭代式视觉增强机制。采用Actor–Critic协作范式,文本大模型生成绘图代码,视觉语言模型提供视觉反馈,通过多轮“生成—评估—修正”闭环优化,提升图表专业性 [18][20][21] - 创新三:采用两阶段写作框架。第一阶段生成针对子任务的分析链,第二阶段以分析链为骨架,组织编排生成长篇报告,有效避免逻辑松散问题 [24][25][26][27] - 在写作阶段引入生成式检索机制,模型根据上下文动态生成数据和图片索引标识符,以保障引用准确性和图文一致性 [29][30] 系统性能与实验结果 - 在高质量基准测试中,FinSight在事实准确性、分析深度与呈现质量三项核心指标上均显著优于对比系统,综合评分达到8.09 [34] - 在可视化维度上,得益于迭代式视觉增强机制,FinSight获得9.00的评分,明显领先 [35] - 系统生成的研报平均长度超过20000字,包含50余张图表与结构化数据引用,且报告质量随篇幅增长保持稳定 [38] - 在AFAC 2025金融智能创新大赛中,FinSight在1289支参赛队伍中排名第一,验证了其在真实场景中的实用性与鲁棒性 [39] 系统意义与行业影响 - FinSight展示了智能体架构在高复杂度垂直领域的潜力,首次在金融投研这一“专家密集型”场景中,展现出接近人类分析师的工作能力 [40] - 这一范式表明,在高度依赖专业知识、长时程推理与多模态表达的领域,AI系统开始承担起类似人类专家的工作方式 [41] - 随着智能体架构成熟,未来的科研分析、法律研判、医疗决策等复杂领域,或将逐步迎来以专家级AI智能体为核心的新一代生产力形态 [42][43]
寻找你的AI同频搭子|「锦秋小饭桌」活动上新
锦秋集· 2025-09-23 17:44
活动信息 - 锦秋小饭桌是为创业者打造的常态化闭门社交活动,每周五晚在北京、深圳、上海、杭州等地举办 [22] - 活动形式为非正式会谈和产品技术人社交饭局,围绕技术、投资、硅谷和国内进展等话题进行真诚交流 [23] - 2025年9月至10月将举办三场活动:9月26日深圳AI Agent专场、10月10日北京具身智能专场、10月17日深圳机器人派对 [3][5][50] 大模型在决策任务中的应用局限 - 现阶段大模型不适合直接用于严肃的长序列决策任务(如游戏AI),其表现不如传统的小型强化学习模型 [25] - 决策任务具有一步错满盘皆输的特性,而大模型擅长的感知/生成任务容错率较高 [25] - 大模型训练数据中缺乏高质量的决策过程知识和数据,例如在斗地主游戏中性能仅能勉强战胜随机出牌的智能体 [26] 信息检索范式演进 - 传统RAG通过外部的Embedding、Ranking、Retrieval等工程化手段进行信息召回 [32] - 新一代模型(如Claude)具备原生上下文感知能力,能自主决定使用何种工具进行语义和场景强相关的信息检索 [33] - 模型原生能力效果好但成本高,适合模型开发者,应用层公司为控制成本仍需采用外部工程方案或混合使用 [35] Agent架构与发展趋势 - 目前主流应用基于React的单智能体模式,通过思考-行动循环完成任务 [36] - 多智能体系统正在兴起,通过规划、解题、验证等多个角色智能体协同工作,可取得超越单智能体的效果 [36] - 让AI Agent交付预期结果的关键在于前期生成清晰明确的需求文档、软件架构图和任务列表 [38] AI Agent基础设施技术流派 - Sandbox模式以Manus为代表,为每个Agent启动一个独立的完整Linux系统沙箱,功能强大但资源消耗大 [39] - 模块化组件模式以AWS Agent Core为代表 [40] AI硬件与交互方式演进 - 通用Agent的机会在于交互方式变革,如从打字到语音输入,未来可能出现新硬件设备利用AI服务时间 [42] - 主动式AI硬件是下一代产品,但面临技术挑战,预计还需2-3年才能被工程化验证 [43] - Meta发布的Rayban Display是中间产品,备货量仅1-2万台,性能表现不佳且演示出现故障 [44] 大模型记忆管理与数据源 - Memory管理是大模型能力提升的下一个赛点,需找到模型自发压缩状态的方案以突破transformer架构的上下文限制 [45] - 拥有多样化数据源的Agent在理解用户语境方面表现更好,例如谷歌通过浏览器、云盘、邮箱等服务覆盖用户生活场景 [46] - 开发专有浏览器是为AI功能提供最高权限的技术路径,可避免频繁权限提示,提供更流畅体验 [46] 创业支持 - 锦秋基金设立Soil种子专项计划,专为早期AI创业者提供资金支持,帮助将创新想法转化为实际应用 [57]