Multi-agent 系统

搜索文档
华泰证券 从Agent,到Multi-Agent
2025-03-10 14:49
纪要涉及的行业和公司 - **行业**:AI、计算机行业 - **公司**:华泰证券、微软、Cloud、苹果、腾讯、Workday、ServiceNow、Salesforce、Cruel AI、Mona、OpenAI、亚马逊 纪要提到的核心观点和论据 - **AI商业化进展**:过去两年全球AI商业化主要成果集中在chatbot领域,市场期待的能替代人类执行连续复杂多步骤任务的agent尚未出现,微软Copilot未实现早期演示效果,原因是模型能力和产品工程化问题[2] - **Minus产品影响**:虽非创新模型,但提供在现有模型能力下实现多任务Agent的新思路,引发开源社区对Agent落地应用的关注和复刻尝试[3][4] - **Multi - agent系统**:是AI发展重要方向,通过多智能体协同工作弥补单个智能体能力不足,如Minus系统不同智能体负责不同任务,由不同模型驱动,提高任务自动化执行能力且工程化落地较好[3][5] - **2024年AI技术突破**:在感知、定义、记忆、规划和行动五个环节取得突破,多模态模型增强感知能力,记忆和上下文处理技术升级,思维链方法提升规划能力,行动环节虚拟机形态解决数据源访问问题,Agent编排能力分配任务[3][6][8][9] - **大模型进展**:在推理与行动上进展显著,通过思维链(COT)方法和推理加行动(Reasoning + Acting)的工程实践实现,企业级应用常见人机协作方式[3][10] - **Code Agent发展**:发展相对成熟,能自动完成编码相关任务并集成到IDE环境,应用场景从代码生成扩展到测试和调试等环节[11] - **通用场景延伸**:关键因素是数据权限放开程度,不同数据处理范围作用不同,苹果和腾讯等公司整合个人行为数据提升个性化服务[12] - **MCP协议作用**:为云端系统设计的通信协议,确保agent信息共享和任务协作标准化,苹果预期打通第三方应用数据权限并整合个人行为数据[13] - **Multi Agent系统现状**:初具雏形,技术能力得到验证,工程化准备相对成熟,多Agent生态有望快速迭代发展[15] - **Multi Agent系统构成要素**:由各类agent、合作类型、系统结构、协作策略、协调机制构成,主流采用动态机制协作[16] - **多智能体协同系统运作**:包括环境与上下文感知、协作层、影响因子,目前处于中期模型共享及相互智能能力交换阶段[17] - **多智能体系统合作模式**:包括合作、竞争、竞争合作三种模式,各有特点[19] - **多智能体系统策略分类**:分为基于规则、基于角色、基于模型三种方法,目前主流是基于模型的协作方式[21] - **多智能体系统结构分类**:分为集中式、分布式、层次式三种,集中式架构较为普遍[22] - **多智能体系统协调机制**:包括静态协调和动态协调,动态架构更为常见[23] - **多智能体验例**:Menus产品采用集中式动态决策、基于模型判断的技术架构,包含信息检索、代码生成、数据分析三类agent[24] - **开源多代理框架**:提供预制技术架构及工具集,有任务执行等多个方向,如Cruel AI、Mona等框架具备关键特征[25] - **多智能体开源架构**:包括Python框架、OpenAI的a one架构、微软AutoGen升级版Magical One、亚马逊AWS上的Motion Agent编排器、OWL by开幕AI等,各有特点和不足[27][29] - **企业需求与布局**:企业有复杂任务编排需求,海外To B软件公司如Workday、ServiceNow和Salesforce等在2025年Q4介绍了multi - agent编排系统,产品落地节奏影响商业化变现[28] - **多智能体技术对互联网影响**:将从个体发展成网络,成为下一代互联网重要组成部分,2025年加速产业化,推动计算机行业股票上涨,各大互联网公司纷纷布局[3][29][30] 其他重要但是可能被忽略的内容 - 2023年感知模块早期大模型主要支持文本理解,多模态模型发展增强视觉理解能力;记忆模块围绕长期、短期记忆及上下文处理技术升级,如Cloud推出MMCP协议;规划模块引入思维链方法[8] - 行动环节虚拟机形态以Minus为例可通过编码或操作屏幕获取网页数据,agent编排能力基于角色分配协同工作,如文档编辑项目[9] - 苹果18.3或18.2系统中用户可选择是否允许AI学习其使用APP习惯,为数据打通和行为数据整合做铺垫[13][14]