Workflow
Gemini Computer Use
icon
搜索文档
AI“超级代理”大战打响!四大赛道全面铺开,OpenAI、Anthropic正挑战微软们的软件帝国
华尔街见闻· 2026-02-13 10:01
文章核心观点 - AI巨头(如OpenAI、Anthropic)与传统企业软件厂商(如微软、Salesforce、ServiceNow)正在AI代理工具领域展开全面竞争,这场竞争可能重塑企业软件市场格局,并被视为一场高风险、赢家通吃的竞赛 [1][2][6] 竞争格局与主要产品类别 - 竞争主要围绕四大类产品展开:基于浏览器的代理、可操作计算机的代理、代理构建工具以及代理管理控制台 [1][2] - 基于浏览器的代理(如OpenAI、谷歌提供)可执行登录供应商网站下单等多步骤任务 [2] - 可操作计算机的代理(如Anthropic的Cowork、谷歌的Gemini Computer Use、ServiceNow的桌面代理)能够使用桌面应用和文件生成财务报告等 [2] - 代理构建工具(如Salesforce的Agentforce、谷歌的Gemini Enterprise)允许客户创建可访问多种企业应用的代理 [2] - 代理管理控制台(如微软的Agent 365、OpenAI的Frontier)是代理运营平台,市场可能呈现赢家通吃的局面,因为每个客户可能只需要一个 [2] 主要参与者的动态与策略 - OpenAI推出了Frontier平台,帮助Uber和Thermo Fisher Scientific等企业创建并管理多个AI协作者 [1] - Anthropic向Windows用户发布了Cowork的研究预览版 [1] - 传统厂商如微软、Salesforce、ServiceNow正在加速推出代理构建工具和管理平台以应对挑战 [1] - 微软CEO Satya Nadella曾预言传统软件应用将在“代理时代”“崩溃”,并讨论过向访问其应用的AI收取订阅费用 [1] - 许多传统企业软件公司(如Salesforce、Snowflake)使用从OpenAI和Anthropic购买的技术来构建自己的代理,而这些AI公司同时也在推广与之竞争的自有工具 [5][6] 市场影响与“记录系统”之争 - 市场预期未来白领员工将不再手动使用企业应用程序,而是监督一系列能够自主连接应用的AI代理 [1] - OpenAI展示其代理指挥技术将位于企业“记录系统”(如微软、Salesforce的应用程序)之上,这被一些传统厂商高管视为OpenAI试图展示其巨大影响力 [5] - 目前传统企业应用公司似乎并未准备直接阻止新AI代理访问其核心应用(如Salesforce CRM、微软Office 365)中的数据,但未来可能会尝试限制访问频率 [5] - Snowflake CEO Sridhar Ramaswamy形容当前竞争态势为“要么达到1万亿美元估值,要么归零”,凸显了高风险性质 [6] 面临的挑战与采用障碍 - 基于浏览器和计算机操作的代理存在巨大的安全责任风险,可能无意中泄露用户凭证或让远程攻击者控制PC [3] - 一些AI买家表示这些产品使用起来过于困难 [3] - 不同公司对代理就绪度的表述存在差异:OpenAI、Anthropic和谷歌称其计算机操作代理仅为研究预览版,而ServiceNow等依赖它们模型的供应商则称其产品已全面上市 [3] - 企业采用面临实际困难,例如希尔顿公司花了近三年时间才将其开发的客户支持代理推向客户 [3][4] - 希尔顿首席技术官表示,尽管市场产品丰富,但并不急于签订新订阅,目前采用多厂商AI产品组合来运行自动化内部代理 [3]
办公场景进入Agent时代,打工人的「工作文件夹」,终于要被AI接管了?
36氪· 2026-01-14 09:07
公司产品发布与定位 - Anthropic于北京时间1月13日推出了Claude Cowork,并将其定位为“用于其他工作的Claude Code”[1] - 公司不打算将其包装为全新的“桌面AI助手”,而是将Claude Code已验证的智能体AI能力迁移至更广泛的PC工作场景,如文件整理、资料处理、内容生成和项目维护[3] - 该产品的工作方式是不追求系统级接管,而是在用户指定的文件夹内,以文件为媒介“代理一切”,包括创建、读取、编辑修改文件、批量更改文件名及整理文件等[4] 产品核心功能与工作模式 - Claude Cowork能处理多种本地文件格式,如.md、.txt、.docx、.html、.pdf等,并将这些本地文件作为AI的最佳上下文[7] - 产品不仅能读取,还能直接创建和修改文件,例如总结会议纪要并找出待办事项,且文件的修改无需人工手动操作[8] - 它保留了“连接器”功能,可直接连接Google Drive、Notion等云端平台和服务,将分散的内容与本地文件整合为AI可调用的关键上下文[8] - 产品支持文件管理功能,例如将“桌面”设为指定文件夹后,可让AI梳理桌面凌乱的文件[9] - 其本质并非基于GUI图形用户界面逐步操作,而是借助操作系统软件接口进行基础操作,并做了沙盒化处理,以规避隐私泄露、攻击及占用用户界面等问题[11] 产品设计理念与价值主张 - Claude Cowork的设计理念是将Claude Code在代码世界(围绕真实工程目录持续工作)中已被验证的执行范式,迁移到更广泛的PC工作场景中,区别在于对象从代码仓库变为文档、表格、素材和项目文件夹[11] - 两者共享同一种Agentic AI的核心逻辑:围绕一个受控的工作空间,将“目标”转化为一系列可被执行和检查的结果[11] - 产品的核心价值在于压缩大量长期存在但常被忽视的办公中间成本,例如项目资料的回顾与整理、零散素材向可用文稿的转化、图片票据向结构化文档的整理,以及长期项目的阶段性维护工作[11] - 这些任务高频、低风险但极其耗时,Claude Cowork的意义在于让AI安全地接手这些工作[12] 行业竞争格局与不同技术路线 - 行业对PC智能体的讨论围绕“能力上限”展开,主要存在两种路线:一种是侧重云端,在简单云端环境发挥智能体能力;另一种是基于现实的PC操作系统环境,模拟人类逐步操作电脑[3] - 以OpenAI的ChatGPT agent为代表的部分厂商选择将执行过程几乎完全放在云端,解决“时间占用”问题,但代价是与本地文件和权限存在隔阂[13] - 以Gemini Computer Use为代表的方案更强调通过图形用户界面进行操作,在可控环境中模拟人类使用电脑,这种方式直观通用,但复杂度与风险较高[15] - 在国内,AI办公走的是不同方向,例如阿里的钉钉和字节的飞书将智能体直接嵌入企业协同平台,AI功能具体表现为会议纪要、待办事项、文档生成等,执行权被严格限制在平台内部以换取权限清晰和风险可控[15] - 豆包手机助手的后台运行模式证明用户愿意将任务交给AI持续运行,但也提前暴露了当智能体AI开始接管系统层时,风控、隐私和越权问题会迅速浮现[15] 产品市场策略与当前状态 - 目前体验Claude Cowork的门槛较高,仅限订阅Claude Max(每月100美元起)的macOS用户,Windows端正在开发,未来是否会下放到Claude Pro(每月17美元)尚未透露[13] - 该产品本身是受Claude Code程序员用户各种用例启发而打造,旨在面向更多元的大众用户[13] - 相比更激进的方案,Claude Cowork没有走云端全托管或本地全局代理路线,而是将执行权严格限定在“用户授权的文件夹”内,再通过云端模型和连接器补齐能力,这种方式不追求极限效率,但最大程度降低了用户的心理负担和使用风险[16] - 该产品提供了一种更容易被接受的中间形态,被认为是AI彻底改变办公体验的开始,并可能是PC智能体真正走向大众之前的起点[4][16]