
纪要涉及的行业和公司 - 行业:AI、计算机行业 - 公司:华泰证券、微软、Cloud、苹果、腾讯、Workday、ServiceNow、Salesforce、Cruel AI、Mona、OpenAI、亚马逊 纪要提到的核心观点和论据 - AI商业化进展:过去两年全球AI商业化主要成果集中在chatbot领域,市场期待的能替代人类执行连续复杂多步骤任务的agent尚未出现,微软Copilot未实现早期演示效果,原因是模型能力和产品工程化问题[2] - Minus产品影响:虽非创新模型,但提供在现有模型能力下实现多任务Agent的新思路,引发开源社区对Agent落地应用的关注和复刻尝试[3][4] - Multi - agent系统:是AI发展重要方向,通过多智能体协同工作弥补单个智能体能力不足,如Minus系统不同智能体负责不同任务,由不同模型驱动,提高任务自动化执行能力且工程化落地较好[3][5] - 2024年AI技术突破:在感知、定义、记忆、规划和行动五个环节取得突破,多模态模型增强感知能力,记忆和上下文处理技术升级,思维链方法提升规划能力,行动环节虚拟机形态解决数据源访问问题,Agent编排能力分配任务[3][6][8][9] - 大模型进展:在推理与行动上进展显著,通过思维链(COT)方法和推理加行动(Reasoning + Acting)的工程实践实现,企业级应用常见人机协作方式[3][10] - Code Agent发展:发展相对成熟,能自动完成编码相关任务并集成到IDE环境,应用场景从代码生成扩展到测试和调试等环节[11] - 通用场景延伸:关键因素是数据权限放开程度,不同数据处理范围作用不同,苹果和腾讯等公司整合个人行为数据提升个性化服务[12] - MCP协议作用:为云端系统设计的通信协议,确保agent信息共享和任务协作标准化,苹果预期打通第三方应用数据权限并整合个人行为数据[13] - Multi Agent系统现状:初具雏形,技术能力得到验证,工程化准备相对成熟,多Agent生态有望快速迭代发展[15] - Multi Agent系统构成要素:由各类agent、合作类型、系统结构、协作策略、协调机制构成,主流采用动态机制协作[16] - 多智能体协同系统运作:包括环境与上下文感知、协作层、影响因子,目前处于中期模型共享及相互智能能力交换阶段[17] - 多智能体系统合作模式:包括合作、竞争、竞争合作三种模式,各有特点[19] - 多智能体系统策略分类:分为基于规则、基于角色、基于模型三种方法,目前主流是基于模型的协作方式[21] - 多智能体系统结构分类:分为集中式、分布式、层次式三种,集中式架构较为普遍[22] - 多智能体系统协调机制:包括静态协调和动态协调,动态架构更为常见[23] - 多智能体验例:Menus产品采用集中式动态决策、基于模型判断的技术架构,包含信息检索、代码生成、数据分析三类agent[24] - 开源多代理框架:提供预制技术架构及工具集,有任务执行等多个方向,如Cruel AI、Mona等框架具备关键特征[25] - 多智能体开源架构:包括Python框架、OpenAI的a one架构、微软AutoGen升级版Magical One、亚马逊AWS上的Motion Agent编排器、OWL by开幕AI等,各有特点和不足[27][29] - 企业需求与布局:企业有复杂任务编排需求,海外To B软件公司如Workday、ServiceNow和Salesforce等在2025年Q4介绍了multi - agent编排系统,产品落地节奏影响商业化变现[28] - 多智能体技术对互联网影响:将从个体发展成网络,成为下一代互联网重要组成部分,2025年加速产业化,推动计算机行业股票上涨,各大互联网公司纷纷布局[3][29][30] 其他重要但是可能被忽略的内容 - 2023年感知模块早期大模型主要支持文本理解,多模态模型发展增强视觉理解能力;记忆模块围绕长期、短期记忆及上下文处理技术升级,如Cloud推出MMCP协议;规划模块引入思维链方法[8] - 行动环节虚拟机形态以Minus为例可通过编码或操作屏幕获取网页数据,agent编排能力基于角色分配协同工作,如文档编辑项目[9] - 苹果18.3或18.2系统中用户可选择是否允许AI学习其使用APP习惯,为数据打通和行为数据整合做铺垫[13][14]