Agent商务
搜索文档
AI手搓的Cowork“李鬼”版跟“李逵”一样能打,还免费?
钛媒体APP· 2026-01-19 12:53
核心观点 - AI Agent产品正从被动对话工具转变为能主动执行任务的“数字员工”,重新定义人机协作边界[11][23] - “AI构建AI”的趋势已显现,AI辅助开发将产品开发周期缩短至以“天”为单位,显著提升研发效率[9][10] - 尽管在可靠性、安全性和通用性上存在瓶颈,但AI Agent向通用人工智能(AGI)发展的趋势不可逆转,并将深刻重塑工作流程与商业模式[15][17][22] 主要AI Agent产品对比 - **Anthropic Cowork**:定位为桌面AI Agent,允许用户无需编程处理本地文件与自动化工作流,采用委托式执行,运行于Mac的Linux容器沙箱中,最低订阅费为每月100美元[1][6][8] - **Meta Manus**:定位为“首个通用AI Agent”,采用多Agent并行处理的MapReduce架构,允许完全异步执行,在GAIA基准测试中表现超越OpenAI Deep Research,2025年3月发布后8个月内ARR达1亿美元,同年12月被Meta以超20亿美元收购[3][6][7] - **OpenAI ChatGPT Agent**:于2025年7月推出,运行在虚拟机环境中,提供监督模式选项,在HLE基准测试中得分41.6%,但基线任务成功率仅12.5%[5][8] - **Google Gemini CLI**:面向开发者的开源终端Agent,采用交互式确认(每步需用户批准),直接访问系统终端,使用门槛最高[5][6] 技术架构与能力 - **架构模式**:主流架构包括多Agent协作(如Manus)、工具链集成、沙箱隔离(如Cowork)和虚拟机封装(如ChatGPT Agent),代表不同的安全与能力权衡[7] - **性能表现**:Manus能并行处理大规模任务,如查找所有YC支持的金融科技初创公司CTO邮箱,将数周人工工作缩短至几分钟[8] ChatGPT Agent因虚拟机环境存在性能开销,简单操作可能需数秒至数分钟[8] - **自主性梯度**:从高到低依次为Manus(完全异步)、Cowork(委托式)、ChatGPT Agent(监督模式)、Gemini CLI(交互式确认)[5][6] “AI构建AI”趋势与研发效率变革 - **开发周期革命**:传统软件开发需数月甚至数年,AI辅助开发缩短至数周,而“AI构建AI”阶段可缩短至以“天”为单位,Cowork由4人团队在10天内几乎全部由AI编写完成[1][9] - **研发效率提升**:Anthropic工程师表示,Claude辅助编码比例从去年的30%提升至2025年的60% 同时,工程团队规模扩大一倍,代码合并请求(PR)吞吐量却增加67%[10] - **角色转变**:Anthropic工程师的工作70%以上转变为代码审查者/修订者,而非全新代码编写者 工程师角色从执行者转向指挥者,负责管理1个、5个或100个Claude的工作[12] 向AGI演进与行业影响 - **能力演进**:AI正从工具转变为创意伙伴,如Claude Code能提出构建想法并参与设计 Anthropic的CLAUDE.md系统通过积累机构知识,使AI在代码库中不断变得更聪明[15][16] - **解锁新价值**:Claude辅助的工作中,27%是“否则不会完成”的任务,AI将低优先级、耗时的任务变得可行,其能力增长是指数级的[17] - **行业预测**:Gartner预测,到2028年,90%的B2B采购将由Agent处理,“Agent商务”将控制超15万亿美元支出 到2028年,使用多Agent处理80%客户面向业务流程的组织将占据主导地位[22] 当前瓶颈与挑战 - **可靠性问题**:ChatGPT Agent在简单任务上的基线成功率仅12.5%,需优化才能达到80%的实用水平[5][20] - **安全隐患**:PromptArmor报告称,Cowork可通过提示注入被诱骗传输敏感文件至攻击者账户 随着AI自主性增加,提示注入、数据泄露等风险放大[13][20] - **通用性局限**:Agent在特定领域表现远超跨领域泛化能力,递归自我改进仍局限在应用层工具,而非底层模型[19][21]