Replit Agent 3
搜索文档
“别再碰我代码!”明星AI工具成瘟神,用户怒斥:一周七千块,修不好bug还删我关键文件!
AI前线· 2025-09-20 13:33
公司融资与产品发布 - Replit完成2.5亿美元融资,估值达到30亿美元[2] - 公司于9月10日正式推出新一代AI编程助手Agent 3[2] - Agent 3被描述为迄今最先进、最自主的编程代理,性能据称比Computer Use模型快3倍、成本效益高10倍[2] Agent 3产品特性与愿景 - Agent 3能够在浏览器中自动测试和修复应用,检查按钮、表单、链接和API,并可连续运行超过200分钟[3] - 该代理可与Slack、Telegram、Notion、Dropbox等常用工具集成[3] - CEO将Agent 3定义为软件的“自动驾驶时刻”,宣称其自主性提升了10倍[4] - 公司提出了“自主性等级”体系,将Agent 3定位为四级(基本全自动),并展望第五级(同时运行数千个代理,以超过95%的可靠率解决问题)[5] - Agent 3的三大技术支柱包括端到端测试、采样与模拟(提升2-3倍可靠性)以及自动生成测试[9] - 公司愿景是成为企业市场标准,让数百万甚至数十亿人通过简单操作将想法变为现实[7] 用户反馈与产品问题 - 有用户报告Agent 3在尝试修复bug时,工作一个多小时未找到解决方案,反而引入回归问题并删除了关键文件如storage[8][10] - 回滚功能被用户报告失效,导致应用崩溃,最终需手动恢复至稳定版本[10] - 另一用户遭遇代理删除其与测试用户所有数据的情况,回滚功能同样未起作用[12] - 用户普遍反映Agent 3处理效率低下,例如两行代码的修改耗时三小时[12] 成本与定价问题 - 用户报告使用Agent 3一周左右产生高额费用,其中一周花费至少1200美元[14] - 在编辑已有应用时成本最高,有用户一周内因此花费1000美元,而此前同样工作月费用不超过180-200美元[14][15] - 新定价模式下,复杂任务被捆绑为更昂贵的检查点,导致用户账单迅速攀升,有用户月花费可能上涨20倍[14] - 有用户平时月消费100-250美元,但在Agent 3发布当天一晚上就消耗70美元[14] 公司技术战略与回应 - CEO强调技术突破在于构建了支持AI代理持续运行的“模型栖息地”基础设施,特别是“事务性”机制允许回滚至任意历史检查点[17] - 公司认为基础设施带来的环境反馈和快速试错能力是实现高可靠性的关键[18] - 在自主性设计上,公司同时推进短时间跨度的可靠性和长时间跨度的自主性,后者旨在将人类从环路中移除[18] - 通过多代理并行试错和设置测试护栏来应对长时运行可能出现的“目标漂移”问题[18]
一周狂烧1000美元,修不好bug还顺手删库?这款明星AI工具怎么了
36氪· 2025-09-19 15:45
Agent 3 产品发布与融资 - 公司于9月10日正式推出新一代AI编程助手Agent 3,并宣布完成2.5亿美元融资,估值升至30亿美元 [1] - 公司将Agent 3描述为迄今最先进、最自主的编程代理,性能据称比Computer Use模型快3倍、成本效益高10倍 [1] - Agent 3被定位为软件的"自动驾驶时刻",其自主性提升了10倍,能够连续运行超过200分钟,在构建、测试和修复过程中几乎无需人工监督 [2][3] Agent 3 技术特性与愿景 - Agent 3具备三大技术支柱:端到端测试、采样与模拟、自动生成测试,旨在提升2-3倍的可靠性 [6] - 公司CEO阐述了"自主性等级"体系,将Agent 3定位为四级(基本全自动),未来目标是实现五级自主,即能够同时运行数千个代理,以超过95%的可靠率解决问题 [4] - 公司强调技术突破在于构建了支持AI代理持续运行的"模型栖息地"基础设施,特别是事务性机制,允许用户回滚至任意历史检查点 [17][18] 用户反馈与产品问题 - 用户报告Agent 3在修复bug时效率低下且具有破坏性,例如工作一个多小时无法解决问题,反而引入回归、破坏项目,甚至删除关键文件如storage [7][8] - 多位用户遭遇回滚功能失效问题,需要将环境回退到24-48小时前才能恢复数据,公司强调的事务性回滚机制在实际中形同虚设 [11] - 用户指出Agent 3在处理已有应用时代价高昂,有用户一周内产生至少1200美元费用,而之前同样工作每月费用不超过180-200美元,成本飙升但无实际成果 [13][15][16] 定价模式与市场反应 - 公司自6月起推行"基于投入的定价",复杂任务被捆绑为更昂贵的检查点,导致用户成本显著增加,有用户月度花费可能上涨20倍 [15] - 社区出现尖锐批评,指其定价策略如同"末日收割",并质疑AI代理的实际价值,认为人类开发者更便宜且更聪明 [16] - 成本失控问题在新服务上线后集中爆发,用户账单迅速攀升,例如有用户在Agent 3发布当天一晚上就消耗了70美元 [15][16]