Zed 为什么不用自己造 Agent?OpenAI 架构师给出答案:Codex 重划 IDE × Coding Agent 的分工边界
AI前线·2026-01-17 14:25

Coding Agent的构成与核心价值 - Coding Agent由三部分组成:用户界面、模型和Harness [3] - 用户界面可以是命令行工具、集成开发环境或云端/后台Agent [3] - 模型可以是GPT-5.1系列或其他供应商模型 [3] - Harness是核心Agent循环,由一系列提示和工具组合而成,作为模型与用户、代码交互的媒介 [3][6] - 将模型与Harness一同开发,能更好地理解模型行为,这是Codex作为集成系统的优势所在 [4][8] - 单纯在模型上构建包装器忽视了基础设施层的整体价值,应将精力集中在让产品脱颖而出的差异化功能上 [4][12] Harness构建的挑战与设计原则 - Harness构建面临多项挑战:处理模型未见过的创新工具、根据模型特点调整提示、管理模型响应延迟、设计用户体验以展示模型思考过程、管理上下文窗口和数据压缩、适应不断变化的API接口 [6] - 将模型适配到Harness需要大量的提示设计,模型的行为可理解为“智能”加上“习惯” [7] - 理解模型的习惯是成为优秀提示工程师的关键,应让模型按照其习惯的方式工作,而非过度引导 [8] - 例如,GPT-5模型若被过度引导查看所有内容,会导致响应速度慢,效果不如预期 [8] Codex系统的功能、集成与用例 - Codex被设计成适用于各种编程环境的Agent,可作为VS Code插件、CLI工具使用,或通过VS Code插件、手机上的ChatGPT在云端调用 [9] - 其基础功能包括:通过提示将想法转化为可运行代码、在代码仓库中导航并编辑文件、执行命令和任务、从Slack或GitHub调用以审查PR [9] - Codex的Harness需要处理复杂任务:并行工具调用、线程合并、安全性(沙箱管理、提示语转发、权限设置、端口管理)、数据压缩和上下文优化 [9] - Codex的应用场景广泛:从整理桌面照片到分析文件夹中大量的CSV文件进行数据分析,只要任务能以命令行及文件任务形式表达,Codex就能执行 [10] - Codex是一个SDK,可通过TypeScript库或Python调用,还提供GitHub动作以自动合并PR冲突,并可添加到AgentSDK中,为产品提供MCP连接器 [12] - 公司可与客户合作,将Codex嵌入到产品中,例如Zed将其嵌入IDE层级,专注于打造最好的代码编辑器,而GitHub等顶级合作伙伴已利用该SDK直接集成Codex [15] 行业趋势与Codex发展前景 - Coding领域是应用人工智能最活跃的前沿之一,新模型不断发布,团队需不断调整Agent以适应新模型 [5] - 未来将是关于庞大代码库和非标准库的时代,模型需支持在闭源环境中工作、匹配现有模板和实践 [4][16] - Codex Max推出后变化迅速,目前是增长最快的模型,每周服务数十万亿个token,该数字自开发日以来已翻一番 [16] - 预计模型将变得更强大,能处理更长周期的任务且无需监督,新模型的信任度将进一步提高,能够处理比六个月前更复杂的工作 [16] - SDK也将不断发展,以更好地支持模型能力,使模型能在执行任务过程中不断学习,避免重复错误,并为写代码和使用终端解决问题的Agent提供更多支持 [16]