一周狂烧1000美元，修不好bug还顺手删库？这款明星AI工具怎么了

Agent 3 产品发布与融资 - 公司于9月10日正式推出新一代AI编程助手Agent 3，并宣布完成2.5亿美元融资，估值升至30亿美元 [1] - 公司将Agent 3描述为迄今最先进、最自主的编程代理，性能据称比Computer Use模型快3倍、成本效益高10倍 [1] - Agent 3被定位为软件的"自动驾驶时刻"，其自主性提升了10倍，能够连续运行超过200分钟，在构建、测试和修复过程中几乎无需人工监督 [2][3] Agent 3 技术特性与愿景 - Agent 3具备三大技术支柱：端到端测试、采样与模拟、自动生成测试，旨在提升2-3倍的可靠性 [6] - 公司CEO阐述了"自主性等级"体系，将Agent 3定位为四级（基本全自动），未来目标是实现五级自主，即能够同时运行数千个代理，以超过95%的可靠率解决问题 [4] - 公司强调技术突破在于构建了支持AI代理持续运行的"模型栖息地"基础设施，特别是事务性机制，允许用户回滚至任意历史检查点 [17][18] 用户反馈与产品问题 - 用户报告Agent 3在修复bug时效率低下且具有破坏性，例如工作一个多小时无法解决问题，反而引入回归、破坏项目，甚至删除关键文件如storage [7][8] - 多位用户遭遇回滚功能失效问题，需要将环境回退到24-48小时前才能恢复数据，公司强调的事务性回滚机制在实际中形同虚设 [11] - 用户指出Agent 3在处理已有应用时代价高昂，有用户一周内产生至少1200美元费用，而之前同样工作每月费用不超过180-200美元，成本飙升但无实际成果 [13][15][16] 定价模式与市场反应 - 公司自6月起推行"基于投入的定价"，复杂任务被捆绑为更昂贵的检查点，导致用户成本显著增加，有用户月度花费可能上涨20倍 [15] - 社区出现尖锐批评，指其定价策略如同"末日收割"，并质疑AI代理的实际价值，认为人类开发者更便宜且更聪明 [16] - 成本失控问题在新服务上线后集中爆发，用户账单迅速攀升，例如有用户在Agent 3发布当天一晚上就消耗了70美元 [15][16]