7小时连续重构不掉线,一骑绝尘的Claude终于遇到对手:Greg Brockman亲自解读AI编程重大突破
36氪·2025-09-17 16:00
9月16日,OpenAI正式推出一款新模型GPT-5-Codex ,这是一个经过微调的 GPT-5 变体,专门为其各种 AI 辅助编程工具而设计。该公司表示,新模型 GPT-5-Codex 的"思考"时间比之前的模型更加动态,完成一项编码任务所需的时间从几秒到七个小时不等。因此,它在代理编码基准测试中表现更佳。 GPT-5-Codex 的发布,为近来"编码代理"(Coding Agents)领域或许最剧烈的一波氛围转折画上了句号。 过去一年多里,从去年 6 月的 Claude 3.5 Sonnet、到 2 月的 3.7 Sonnet 与 Claude Code,再到 5 月的 Claude 4,Anthropic 在编码场景几乎是一骑绝尘,牢牢 占据主导地位。期间公司营收一路飙升至 50 亿美元(其中 10% 来自 Claude Code),市值冲到 1830 亿美元,单单增加了 1220 亿美元市值。 GPT-5-Codex 在 SWE-bench 上的得分是 74.5%,几乎与 GPT-5 thinking 在 477 子集上的 74.9% 持平。那么,是什么让 GPT-5 的整体口碑迎来大逆转? 原因之 ...