「开发者私下更喜欢用GPT-5写代码」，Claude还坐得稳编程王座吗？

编程模型性能比较 - Anthropic的Claude Opus 4.1在软件编程权威基准SWE-bench Verified测试中表现优异尤其在多文件代码重构方面有显著进步[1] - OpenAI的GPT-5在编程赛道获得更多青睐用户反馈其编程能力优于Claude 可处理复杂编程任务和大规模代码重构[3][5][6] - 用户实际使用中 GPT-5在指令遵循方面表现突出能够处理"把这个改得更像那个"等复杂重构指令[6] 模型适用场景差异 - Claude被部分用户认为是"偏科型选手" 在编程领域表现出色但其他领域幻觉率较高尤其在健康医疗类问题上存在严重幻觉风险[9][10] - GPT-5在多领域表现均衡幻觉率显著低于Claude 在商品搜索等实际应用中能提供准确结果[9][10] - Claude在代码补全速度方面优于GPT-5 在VIM编辑器中使用Opus进行代码补全速度更快[4] 用户使用偏好变化 - 开发者开始转向使用GPT-5进行编程工作有人表示已基本完全不用Claude Opus[3] - 用户同时使用多个模型 Claude Code与GPT-5 reasoning high组合使用获得更多信任[4] - 根据旧金山"小道消息" 很多人私下更偏好使用GPT-5写代码这与"Claude更擅长编程"的流行叙事相反[7] 模型特性对比 - GPT-5的幻觉率和通用实用性显著优于Claude 在各个领域表现都不错[8][11] - Claude在写作方面"温度感"更强作为学习伙伴能引导用户逐步接近答案而非直接给出答案[9] - GPT-5具备强大的搜索功能能处理具体尺寸、颜色等要求的商品搜索任务[9]