清华大学：《2026全球通用智能体竞争研究报告》

清华大学清新研究团队《2026全球通用智能体竞争研究报告》核心观点 - 判断通用智能体竞争格局的核心指标已从模型基准分数转向任务交付能力与工作台入口控制力市场对AI竞争格局的解读不应再以OpenAI、谷歌、Anthropic等“底座能力层”的模型供应商为中心真正的竞争主战场在产品层由Manus、Genspark、Flowith等平台争夺成为用户的“默认任务承接方” [1] - 通用智能体的本质被重新定义核心不是“谁更会答题” 而是“谁更像一个能接活、能交付、能持续协作的数字同事” 必须能够接收开放性任务、自主拆解步骤、调用工具执行并交付可用结果 [2] - 报告提出了“原语层与产品层分离”的首创概念明确区分底座厂商与产品层玩家在价值链上的不同位置前者提供能力基础设施后者提供用户实际工作体验 [8] - 竞争的未来决定性变量不是谁拥有更大的模型而是谁掌握了用户的工作流通用智能体竞争将越来越像产品竞争而非模型排名竞争 [10] - 报告划定了新的分析标准如果报告主轴还是GPT、Gemini、Claude 那就还不是通用智能体报告 [11] 产品层竞争的三条核心路线 Manus：强执行代理路线 - 关键差异化在于BrowserOperator机制允许系统直接在用户本地浏览器中操作利用现有登录状态与活动标签页比纯粹的云端浏览器代理更接近真实生产环境 [4] - 具备文件生成与交付能力能将任务结果输出为PPT、网站、代码等实质性产物实现了从“信息交付”到“成果交付”的跨越 [4] - 报告将其定位为争夺“交付心智” 其官方表述为“不像ChatGPT给出答案 Manus交付的是工作成果” [4] Genspark：套件化工作台路线 - 被定义为“agent-native工作套件” 通过整合AI Slides、AI Sheets、AI Docs、AI Designer、AI Developer与Teams等模块进入统一工作台 [5] - 争夺的是更持久的“工作台入口” 而非单次任务交付这种结构设计能形成“工作台护城河” 用户迁移成本随使用深度快速累积 [5] - 报告将其定位为争夺“工作台入口” 其护城河类比于操作系统层面的切换成本入口一旦固化竞争对手以功能对抗很难形成有效冲击 [5] Flowith：上下文操作系统路线 - 定位为“canvas-first的上下文空间” 通过Canvas、Recipe、Nodes与Knowledge Garden将智能体行为显式化构建支持深度研究、复杂项目推进与长期知识积累的协作环境 [6] - 将自身定义为“next-generation AI Agent Operating System” 野心是成为智能体运行的默认环境本身而非某类任务的最佳工具 [6] - 报告以“自我优化、记忆与速度”为关键词捕捉其产品哲学判断其在深度研究与长期知识工作场景中具有最高辨识度定位为争夺“上下文操作系统” [6] - 三条路线短期内更可能共存于市场而非某一方完成对另外两者的全面覆盖 [6] 对大型AI实验室的重新定位 - OpenAI、谷歌、Anthropic的主要贡献发生在“原语层”而非“产品层” 它们更接近“底座能力层”的动作原语供应商 [1][7] - 报告将三家的核心价值概括为提供“computer use、browser use、tool use”等动作原语这些是感知、理解、操作与交互能力的基础层供给决定了智能体的能力上限 [7][8] - 能够点击网页、切换工具、执行复杂流程不等于成为用户心目中默认的通用智能体真正占领用户心智的是把原语做成完整任务产品的人 [8] - 原语层与产品层的关系是垂直分工而非零和对立 [8] 竞争维度的重构与核心概念五个核心竞争维度 - 报告系统提出了五个核心竞争维度以替代以模型参数和基准测试为中心的评价体系包括任务交付能力、环境控制能力、工作台与记忆、用户入口与平台黏性以及企业治理与控制面 [9] - 这五个维度覆盖了从单次任务交付到长期工作流控制的完整竞争图谱 [9] 广度智能体与深度智能体 - 报告引入“广度智能体”与“深度智能体”的区分框架来处理通用型平台与垂直代理之间的关系 [9] - 以Devin为例其被定性为“最典型的高价值垂直代理” 核心场景是软件工程其深度优势来自于放弃广度覆盖 [9] - 判断广度智能体与深度智能体将长期并存前者争夺通用任务的默认入口后者在专业场景建立难以替代的纵深壁垒 [10] 交付替换权 - “交付替换权”是报告提出的最具战略落地价值的原创概念指一旦某个智能体成为用户处理各类任务的默认承接方它便会演变为新的工作入口具备持续的任务支配力 [10] - 谁先在这一位置建立稳定的用户认知谁便更接近通用智能体时代的平台红利 [10] - 用户会围绕那些真正能把活做完的智能体迁移这种迁移产生的数据、记忆与工作流惯性将形成远比模型领先更持久的竞争优势 [10]