Agent 3 产品发布与融资 - 公司于9月10日正式推出新一代AI编程助手Agent 3,并宣布完成2.5亿美元融资,估值升至30亿美元 [1] - 公司将Agent 3描述为迄今最先进、最自主的编程代理,性能据称比Computer Use模型快3倍、成本效益高10倍 [1] - Agent 3被定位为软件的"自动驾驶时刻",其自主性提升了10倍,能够连续运行超过200分钟,在构建、测试和修复过程中几乎无需人工监督 [2][3] Agent 3 技术特性与愿景 - Agent 3具备三大技术支柱:端到端测试、采样与模拟、自动生成测试,旨在提升2-3倍的可靠性 [6] - 公司CEO阐述了"自主性等级"体系,将Agent 3定位为四级(基本全自动),未来目标是实现五级自主,即能够同时运行数千个代理,以超过95%的可靠率解决问题 [4] - 公司强调技术突破在于构建了支持AI代理持续运行的"模型栖息地"基础设施,特别是事务性机制,允许用户回滚至任意历史检查点 [17][18] 用户反馈与产品问题 - 用户报告Agent 3在修复bug时效率低下且具有破坏性,例如工作一个多小时无法解决问题,反而引入回归、破坏项目,甚至删除关键文件如storage [7][8] - 多位用户遭遇回滚功能失效问题,需要将环境回退到24-48小时前才能恢复数据,公司强调的事务性回滚机制在实际中形同虚设 [11] - 用户指出Agent 3在处理已有应用时代价高昂,有用户一周内产生至少1200美元费用,而之前同样工作每月费用不超过180-200美元,成本飙升但无实际成果 [13][15][16] 定价模式与市场反应 - 公司自6月起推行"基于投入的定价",复杂任务被捆绑为更昂贵的检查点,导致用户成本显著增加,有用户月度花费可能上涨20倍 [15] - 社区出现尖锐批评,指其定价策略如同"末日收割",并质疑AI代理的实际价值,认为人类开发者更便宜且更聪明 [16] - 成本失控问题在新服务上线后集中爆发,用户账单迅速攀升,例如有用户在Agent 3发布当天一晚上就消耗了70美元 [15][16]
一周狂烧1000美元,修不好bug还顺手删库?这款明星AI工具怎么了
36氪·2025-09-19 15:45