Workflow
人工智能编程模型
icon
搜索文档
OpenAI 推出 GPT-5.1-Codex-Max 编程模型:可 “通宵” 处理任务,性能跑分超越谷歌
环球网资讯· 2025-11-20 12:25
模型发布与性能表现 - OpenAI正式发布新一代智能体编程模型GPT-5 1-Codex-Max 取代GPT-5 1-Codex成为Codex集成界面的默认模型 [1] - 新模型在SWE-Bench Verified测试中准确率达77 9% 小幅领先谷歌Gemini 3 Pro的76 2% [2] - 在Terminal-Bench 2 0测试中以58 1%的准确率优于Gemini 3 Pro的54 2% 在LiveCodeBench Pro编码Elo基准测试中与Gemini 3 Pro的2439分持平 [2] 技术创新与效率提升 - 模型核心亮点是引入"压缩"机制 可在接近上下文窗口限制时智能保留关键信息 实现跨越数百万token的连续工作而不降低性能 [2] - 依托新机制 模型在内部测试中成功完成持续超过24小时的复杂任务 token效率提升约30% 有效降低开发成本与响应延迟 [2] - 公司内部95%的工程师每周使用Codex系列工具 工程师平均拉取请求提交量提升约70% 开发效率显著提高 [3] 产品集成与应用定位 - GPT-5 1-Codex-Max已集成到公司旗下多个Codex开发环境 包括官方命令行工具 内部代码审查工具及各类交互式编程环境 [3] - 开发者可通过工具体验强化学习训练可视化 光学定律模拟等实时交互功能 模型暂未通过公共API开放 后续将逐步推进 [3] - 模型定位为编码"助手"而非人类替代品 为保障安全与透明度 会生成详细的终端日志和测试引用 且默认运行于严格的沙盒环境 [3]