Workflow
「开发者私下更喜欢用GPT-5写代码」,Claude还坐得稳编程王座吗?
机器之心·2025-08-27 11:18

编程模型性能比较 - Anthropic的Claude Opus 4.1在软件编程权威基准SWE-bench Verified测试中表现优异 尤其在多文件代码重构方面有显著进步[1] - OpenAI的GPT-5在编程赛道获得更多青睐 用户反馈其编程能力优于Claude 可处理复杂编程任务和大规模代码重构[3][5][6] - 用户实际使用中 GPT-5在指令遵循方面表现突出 能够处理"把这个改得更像那个"等复杂重构指令[6] 模型适用场景差异 - Claude被部分用户认为是"偏科型选手" 在编程领域表现出色但其他领域幻觉率较高 尤其在健康医疗类问题上存在严重幻觉风险[9][10] - GPT-5在多领域表现均衡 幻觉率显著低于Claude 在商品搜索等实际应用中能提供准确结果[9][10] - Claude在代码补全速度方面优于GPT-5 在VIM编辑器中使用Opus进行代码补全速度更快[4] 用户使用偏好变化 - 开发者开始转向使用GPT-5进行编程工作 有人表示已基本完全不用Claude Opus[3] - 用户同时使用多个模型 Claude Code与GPT-5 reasoning high组合使用获得更多信任[4] - 根据旧金山"小道消息" 很多人私下更偏好使用GPT-5写代码 这与"Claude更擅长编程"的流行叙事相反[7] 模型特性对比 - GPT-5的幻觉率和通用实用性显著优于Claude 在各个领域表现都不错[8][11] - Claude在写作方面"温度感"更强 作为学习伙伴能引导用户逐步接近答案而非直接给出答案[9] - GPT-5具备强大的搜索功能 能处理具体尺寸、颜色等要求的商品搜索任务[9]