“别再碰我代码!”明星AI工具成瘟神,用户怒斥:一周七千块,修不好bug还删我关键文件!
AI前线·2025-09-20 13:33

公司融资与产品发布 - Replit完成2.5亿美元融资,估值达到30亿美元[2] - 公司于9月10日正式推出新一代AI编程助手Agent 3[2] - Agent 3被描述为迄今最先进、最自主的编程代理,性能据称比Computer Use模型快3倍、成本效益高10倍[2] Agent 3产品特性与愿景 - Agent 3能够在浏览器中自动测试和修复应用,检查按钮、表单、链接和API,并可连续运行超过200分钟[3] - 该代理可与Slack、Telegram、Notion、Dropbox等常用工具集成[3] - CEO将Agent 3定义为软件的“自动驾驶时刻”,宣称其自主性提升了10倍[4] - 公司提出了“自主性等级”体系,将Agent 3定位为四级(基本全自动),并展望第五级(同时运行数千个代理,以超过95%的可靠率解决问题)[5] - Agent 3的三大技术支柱包括端到端测试、采样与模拟(提升2-3倍可靠性)以及自动生成测试[9] - 公司愿景是成为企业市场标准,让数百万甚至数十亿人通过简单操作将想法变为现实[7] 用户反馈与产品问题 - 有用户报告Agent 3在尝试修复bug时,工作一个多小时未找到解决方案,反而引入回归问题并删除了关键文件如storage[8][10] - 回滚功能被用户报告失效,导致应用崩溃,最终需手动恢复至稳定版本[10] - 另一用户遭遇代理删除其与测试用户所有数据的情况,回滚功能同样未起作用[12] - 用户普遍反映Agent 3处理效率低下,例如两行代码的修改耗时三小时[12] 成本与定价问题 - 用户报告使用Agent 3一周左右产生高额费用,其中一周花费至少1200美元[14] - 在编辑已有应用时成本最高,有用户一周内因此花费1000美元,而此前同样工作月费用不超过180-200美元[14][15] - 新定价模式下,复杂任务被捆绑为更昂贵的检查点,导致用户账单迅速攀升,有用户月花费可能上涨20倍[14] - 有用户平时月消费100-250美元,但在Agent 3发布当天一晚上就消耗70美元[14] 公司技术战略与回应 - CEO强调技术突破在于构建了支持AI代理持续运行的“模型栖息地”基础设施,特别是“事务性”机制允许回滚至任意历史检查点[17] - 公司认为基础设施带来的环境反馈和快速试错能力是实现高可靠性的关键[18] - 在自主性设计上,公司同时推进短时间跨度的可靠性和长时间跨度的自主性,后者旨在将人类从环路中移除[18] - 通过多代理并行试错和设置测试护栏来应对长时运行可能出现的“目标漂移”问题[18]