Workflow
Claude 3.5/3.7 Sonnet
icon
搜索文档
AI编程「反直觉」调研引300万围观!开发者坚信提速20%,实测反慢19%
机器之心· 2025-07-13 12:58
机器之心报道 编辑:杜伟 随着大模型的崛起,AI编程领域正在发生翻天覆地的变化。 各种编程大模型、编程工具涌现,通过自动补全代码、自动 debug 等实用的功能为开发者的日常工作提供极大便利,并在一定程度上提升了开发效率。 不过,问题来了,AI 编程工具带来的影响真是如此吗? 近日,一家非营利性 AI 调研机构「METR」进行了一项随机对照实验,旨在了解 AI 编程工具如何加速经验丰富的开源开发者的工作效率。 结果却是非常令人意外: 开发者本来坚信使用使用 AI 工具后速度可以提升 20%,但实际上速度却比没有使用 AI 工具时慢了 19%。 这一结论在社交媒体 X 上爆 了,阅读量几乎要突破 300 万。 如下图所示:与专家预测和开发者本来的直觉相反,2025 年初的 AI 编程工具将减缓经验丰富的开发者的开发速度。在本次随机对照实验中,16 位拥有中等 AI 编 程经验的开发者完成了 246 项大型复杂项目的任务,他们平均拥有 5 年开发经验。 对于这项调研,网友反应不一。有人感同身受,表示赞同。 有人则对 METR 的测量指标产生了质疑,表示「完成任务的时间」不能与「生产力」划等号,并且中等 AI 经验 ...
用AI写代码效率反降19%!246项任务实测,16位资深程序员参与
量子位· 2025-07-12 09:49
AI工具对开发者效率的影响 - 在真实开源项目实验中,使用AI工具导致任务完成时间增加19%,与开发者预期效率提升24%相反[1][15][16] - 16位经验开发者完成246项任务(136项允许使用AI,110项禁止),涉及平均23K星、110万行代码的仓库[6][14] - AI组开发者减少主动编码和搜索时间,但增加33%时间用于审查AI输出、调整提示和等待生成[20][22] 实验设计与执行细节 - 任务来自开发者真实代码库,包括错误报告和功能请求,通过随机分配决定是否使用Cursor Pro+Claude 3.5/3.7 Sonnet[7][10][11] - 开发者平均5年经验,在实验仓库有1,500次提交记录,对熟悉度高的任务AI减速效应更明显[28] - 仓库平均存在10年,规模达110万行代码,AI在复杂环境中表现更差[28] 关键影响因素分析 - **直接生产力损失**:开发者仅接受44%的AI生成代码,9%时间用于清理AI输出,AI缺乏对隐式上下文的理解[28] - **实验偏差**:47%的AI任务产生更多代码行数,开发者存在因实验要求过度使用AI的情况[30] - **AI局限性**:生成延迟占4%工作时间,开发者主要采用基础提示策略,未充分挖掘模型潜力[30] 行业应用现状 - SAP调查显示AI平均每日节省1小时,但企业将节省时间转化为更高产出要求,如亚马逊要求用AI实现"更精简团队完成更多工作"[36][37][38] - 开发者使用AI时提交的PR质量与传统方式无显著差异,但代码审查时间相近[30]