产品发布 - OpenAI正式发布Codex 这是一款基于云端运行的软件工程智能Agent 能够并行处理多个开发任务 协助开发者高效完成编程工作 [2][3] - Codex的核心模型为codex-1 这是OpenAI o3系列里专为软件工程微调过的版本 在SWE-Bench的得分为72.1% 纸面参数优于Claude 3.7以及o3-high [8][9] - 同步推出专为命令行优化的轻量模型codex-mini-latest 支持开发者在本地环境快速接入AI 价格为每百万输入tokens花费1.5美元 每百万输出tokens花费6美元 支持高达75%的提示缓存折扣 [27][29] 产品功能 - 提供输入框和两个按钮"Ask"和"Code" 用户只需明确描述任务 Codex就会开始执行 [3] - 能胜任编写功能代码 理解代码结构 回答关于代码库的问题 修复bug 直接提交可审查的拉取请求 每个任务都在云端独立的沙箱环境中执行 运行时长从1分钟到30分钟不等 [5] - 能够理解整个代码库的结构 自动定位并修复bug 处理超时设置或拼写错误等常见问题 分析命令行报错原因 自动生成修复脚本和测试用例 具备代码审查功能 [18] - 通过AGENTS.md文件 用户可自定义Codex的行为 让它更贴合具体项目的开发规范与测试标准 [6] 目标用户与市场定位 - 主要面向专业开发者 设计核心优势在于提高高级开发者的工作效率 使他们能够同时管理多个任务 [22] - 适合技术主管 在已有项目中添加功能或修复bug的场景 但不适合从零开始的"一人十亿级美元SaaS"项目 [23] - 从今天开始向ChatGPT Pro Enterprise和Team用户开放 Plus和Edu用户的支持也将很快上线 [13][28] 技术特点 - 训练方式通过在真实开发环境中进行强化学习 能够生成更符合人类编码风格和审查偏好的代码 严格按照指令执行 并不断运行测试直到通过为止 [12] - 安全性方面 执行任务时只会访问用户提供的代码库和预设依赖 不能联网或访问外部API 遇到不确定问题会停下来提示处理 经过专门训练能够识别并拒绝与恶意开发相关的请求 [15][16] 行业影响 - OpenAI已在内部广泛使用Codex 协助工程师完成重构 命名规范 编写测试等重复性任务 显著提升开发效率 外部合作团队如Cisco与Temporal也给出积极反馈 [17] - Codex被视为未来协作模式的雏形 多代理 异步执行 自动汇报进度等逻辑未来可能内嵌进IDE Git工具甚至Slack 成为开发者真正的"副驾驶" [30] - 过去对AI编程助手的畅想 如自动写代码 提PR 修bug 终于在Codex身上以可用工具的形式落地 成为真正能上手 能跑进实际工作流的产品 [32]
OpenAI最强编程智能体上线ChatGPT,AI的“终极外挂”来了
虎嗅·2025-05-17 07:24