Workflow
两年内打造AI软件工程师!OpenAI Codex 作者解密人机结对编程新模式
AI科技大本营·2025-05-26 18:14

文章核心观点 - AI正从辅助工具进化为能独立思考、访问终端、拥有专属电脑的智能体软件工程师,彻底改写软件开发未来[3] - 赋予AI模型访问终端的权限是OpenAI团队初见AGI曙光的关键时刻,催生了为智能体配备专属计算机的构想[3] - OpenAI核心成员预测未来两年内有望打造出能独立完成软件工程工作的智能体软件工程师[3] - Codex不仅是编码模型,更是擅长独立完成软件工程工作、能长时间自主工作的智能体,追求一次性搞定复杂任务[3] - 在AI时代,模型本身就是产品核心,未来模型将承担更多决策,人类开发者则更聚焦于AI尚不擅长的架构设计与创新性工作[3] Codex项目的缘起与愿景 - Codex项目缘起于赋予模型访问终端权限带来的AGI曙光乍现时刻,以及构建智能体软件工程师的宏伟蓝图[3] - 项目核心理念是赋予智能体访问计算机的能力,为智能体配备专属电脑[8] - 团队观察到一旦给推理模型工具,它就能真正化身为一个配备了工具、拥有环境和安全边界的智能体[5] - 团队致力于推动智能体软件工程师的发展,认为Codex还处于非常初级的阶段,未来将整合不同模式[10][11][52] 产品形态与技术特点 - Codex提供CLI和云端两种形态,允许在OpenAI云端运行Codex智能体[13][14] - 产品追求一次性搞定复杂任务的能力,智能体可以长时间独立工作,任务时长在1到30分钟之间,硬性上限为一小时[17][39] - 系统设置最大并发限制,目前为每小时60个任务,支持用户并行委派多个任务[42][43][44] - 智能体运行时切断互联网访问,采取保守安全策略,未来可能允许有限度地访问特定域名或代码仓库[48][49] 智能体能力与工程实践 - Codex智能体具备长时间独立思考能力,能够编写代码、辅助脚本、测试修改并完整思考变更[15][16][17] - 模型擅长遵循指令和推断代码风格,能够写出简洁的PR描述并符合代码仓库格式[15][16] - 智能体会积极测试更改,并以友好方式显示测试结果,引用日志中的参考信息[16] - 团队训练模型写出漂亮简短的PR描述,PR标题会符合代码仓库格式,并引用相关代码[16] 开发者最佳实践 - 使用agentsmd文件可以显著提升智能体表现,该文件用于存放需要告诉智能体但无法从readme中自动获取的信息[18][21][28][29] - 配置代码检查工具和格式化工具能为智能体提供优势,相当于人类开发者的开箱即用检查功能[18][22] - 让代码库易于被发现和维护良好工程实践有助于智能体更快理解代码库,模块化架构比以往更重要[23][24][25] - 有意识地命名代码和项目,避免常见字符串,可以方便智能体高效搜索和理解[26] - 建议使用TypeScript等提供类型信息的语言,代码越模块化、越容易测试,智能体表现越好[24] 模型与产品哲学 - 在AI产品设计中,模型本身就是产品核心,需要思考用户、开发者和模型三方各自的最佳决策点[35] - 产品设计倾向于提示并信任模型,而非构建确定性程序,尽可能将复杂性推给模型处理[34][35][37] - 目标是构建一个未来模型能够做出所有决策的系统,真正发挥模型全部潜能[34] - Codex被视为探索AGI如何造福人类的思想实验,最终目标是融入通用的AGI超级助手中[52][58] 未来发展方向 - 团队关注多模态输入、网络访问权限等功能的增强,希望产品更紧密融入开发者日常工具[53][55] - 长远愿景是用户不必费心区分委派任务给AI还是与AI协作,实现完全自然的人机交互[44] - 定价策略将基于交付的价值,目标是展示智能体为用户完成具有经济价值的工作[57][58] - 未来将把编码智能体融入通用的AGI超级助手中,实现无处不在、随时伴你左右的智能体体验[52][58]