Claude 3.5/3.7

搜索文档
AI编程「反直觉」调研引300万围观!开发者坚信提速20%,实测反慢19%
机器之心· 2025-07-13 12:58
机器之心报道 编辑:杜伟 随着大模型的崛起,AI编程领域正在发生翻天覆地的变化。 各种编程大模型、编程工具涌现,通过自动补全代码、自动 debug 等实用的功能为开发者的日常工作提供极大便利,并在一定程度上提升了开发效率。 不过,问题来了,AI 编程工具带来的影响真是如此吗? 近日,一家非营利性 AI 调研机构「METR」进行了一项随机对照实验,旨在了解 AI 编程工具如何加速经验丰富的开源开发者的工作效率。 结果却是非常令人意外: 开发者本来坚信使用使用 AI 工具后速度可以提升 20%,但实际上速度却比没有使用 AI 工具时慢了 19%。 这一结论在社交媒体 X 上爆 了,阅读量几乎要突破 300 万。 如下图所示:与专家预测和开发者本来的直觉相反,2025 年初的 AI 编程工具将减缓经验丰富的开发者的开发速度。在本次随机对照实验中,16 位拥有中等 AI 编 程经验的开发者完成了 246 项大型复杂项目的任务,他们平均拥有 5 年开发经验。 对于这项调研,网友反应不一。有人感同身受,表示赞同。 有人则对 METR 的测量指标产生了质疑,表示「完成任务的时间」不能与「生产力」划等号,并且中等 AI 经验 ...
用AI写代码效率反降19%!246项任务实测,16位资深程序员参与
量子位· 2025-07-12 09:49
AI工具对开发者效率的影响 - 在真实开源项目实验中,使用AI工具导致任务完成时间增加19%,与开发者预期效率提升24%相反[1][15][16] - 16位经验开发者完成246项任务(136项允许使用AI,110项禁止),涉及平均23K星、110万行代码的仓库[6][14] - AI组开发者减少主动编码和搜索时间,但增加33%时间用于审查AI输出、调整提示和等待生成[20][22] 实验设计与执行细节 - 任务来自开发者真实代码库,包括错误报告和功能请求,通过随机分配决定是否使用Cursor Pro+Claude 3.5/3.7 Sonnet[7][10][11] - 开发者平均5年经验,在实验仓库有1,500次提交记录,对熟悉度高的任务AI减速效应更明显[28] - 仓库平均存在10年,规模达110万行代码,AI在复杂环境中表现更差[28] 关键影响因素分析 - **直接生产力损失**:开发者仅接受44%的AI生成代码,9%时间用于清理AI输出,AI缺乏对隐式上下文的理解[28] - **实验偏差**:47%的AI任务产生更多代码行数,开发者存在因实验要求过度使用AI的情况[30] - **AI局限性**:生成延迟占4%工作时间,开发者主要采用基础提示策略,未充分挖掘模型潜力[30] 行业应用现状 - SAP调查显示AI平均每日节省1小时,但企业将节省时间转化为更高产出要求,如亚马逊要求用AI实现"更精简团队完成更多工作"[36][37][38] - 开发者使用AI时提交的PR质量与传统方式无显著差异,但代码审查时间相近[30]
AI的应用正在发生变化
小熊跑的快· 2025-06-09 10:24
行业趋势 - AI算力结构从训练转向推理应用 全球推理芯片租赁价格明显上涨[3][5][6] - 微软云tokens调用量1-4月环比增长5倍 单月突破50万亿tokens 阿里云日token量达3万亿 环比暴增4倍[5] - 推理芯片需求激增带动博通股价涨幅超越英伟达 创历史新高[6] 芯片市场动态 - 全球三大推理主力芯片租赁价格近期持续攀升[3] - 训练主力芯片H100租赁价格出现下降趋势 国内厂商加速海外部署[4] - H100价格走势图显示训练卡市场供需变化[7] AI应用发展 - Claude 3 5/3 7和Gemini 2 5成为最受欢迎的AI基模 调用量显著增长[4] - 美股AI行业应用板块全面创新高 涵盖军事 教育等多个领域[6] - 美股AI主线已完成突破性上涨 与A股市场形成对比[8]
AI 编程工具 Windsurf 突遭 Claude 全面断供,CEO 发帖控诉,网友大量退订…
程序员的那些事· 2025-06-05 10:27
核心观点 - Anthropic突然切断编程工具Windsurf对Claude 3.5/3.7模型的直连权限,仅提前5天通知,引发行业震动[3] - 断供事件反映AI行业从开放协作转向生态割据,模型厂商通过API控制生态链,中小公司面临站队或自研的选择[9][10] - 事件直接诱因是Windsurf被OpenAI以30亿美金收购,同时其自研SWE-1模型对Anthropic构成竞争[5][6] 事件经过 - 5月22日Claude 4发布时,Windsurf已被限制只能通过高价第三方渠道接入,埋下断供伏笔[3] - 6月4日Anthropic正式切断Windsurf的API直连权限,导致开发者工具突然失效[1][3] - 受影响开发者大量迁移至Cursor等替代工具,引发对AI工具稳定性的信任危机[7][8] 断供原因分析 竞争关系激化 - Windsurf被OpenAI收购后成为Anthropic直接竞争对手,模型供应关系本质改变[5] - Windsurf自研的SWE-1模型性能接近Claude 3.5但成本更低,直接威胁Anthropic技术优势[6] 生态战略调整 - Anthropic2月推出Claude Code,5月开发者大会明确"Code with Claude"战略,加速布局编程工具市场[7] - 断供是典型的生态闭环策略,通过API控制强化自有生态竞争力[9] 行业影响 开发者层面 - 免费用户被直接清退,付费用户需自行配置API密钥,工作流突然中断[7] - 事件暴露依赖第三方模型的风险,促使开发者考虑多平台备份方案[10] 市场格局演变 - 大模型厂商(OpenAI/Anthropic/Google)通过收购或断供加速生态割据[9] - 中小公司面临"数字领土"挤压,必须选择技术自立或战略站队[10] 长期趋势 - AI行业进入"春秋战国"时代,开放协作被生态竞争取代[10] - 模型API成为战略资源,类似"数字石油"的控制权争夺将加剧[11]