Harness
搜索文档
Zed 为什么不用自己造 Agent?OpenAI 架构师给出答案:Codex 重划 IDE × Coding Agent 的分工边界
AI前线· 2026-01-21 15:00
Coding Agent的构成与核心架构 - 一个Coding Agent由三部分组成:用户界面、模型和Harness(工具集)[4] - Harness是直接与模型交互的核心Agent循环,由一系列提示和工具组合而成,为模型提供输入和输出[4] - 将模型与Harness一同开发,能更好地理解模型的行为,这是Codex作为集成系统的优势所在[5][10] 构建高效Harness面临的挑战 - 新工具适配问题:为Agent提供模型从未见过或不擅长使用的创新工具时,需要花费时间根据模型特点调整Prompt[8] - 延迟与用户体验:模型处理问题需要时间,需设计提示以避免延迟过长,并决定如何向用户展示模型的思考过程[9] - 上下文窗口与数据压缩:管理上下文窗口和数据压缩是一大难题,需决定何时触发压缩及重新注入数据[9][12] - API接口变化:API接口不断变化(如完成功能、响应功能),需确保模型能熟练使用新工具以发挥最大智能[9] - Prompt设计复杂性:将模型适配到Harness中需要大量的Prompt设计,需理解模型的“习惯”(即训练形成的解决问题方式)[9][10] Codex作为Harness/Agent的功能与能力 - Codex被设计成适用于各种编程环境的Agent,可作为VS Code插件、CLI工具使用,或通过云端调用[12] - 核心功能包括:将提示想法转化为可运行代码、在代码仓库中导航并编辑文件、执行命令和任务、审查PR[12] - Harness需处理复杂任务:并行工具调用、线程合并、安全性(沙箱管理、权限设置)、数据压缩和上下文优化[12] - 能力扩展:Codex不仅能处理Coding任务,任何能通过命令行工具表达的任务(如整理文件、分析CSV数据)都能执行[13] 利用Codex构建自定义Agent的模式与集成 - 关键模式是使Harness成为新的抽象层,开发者无需在每次模型升级时优先优化提示和工具,可将精力集中于产品的差异化功能[5][15] - Codex提供多种集成方式:作为SDK通过TypeScript或Python库调用、提供GitHub动作自动合并PR冲突、可添加到AgentSDK并提供MCP连接器[15] - 企业级应用:可构建能为每个客户即时编写插件连接器的软件,实现完全可定制化,并具备自我对话与自动修复bug的能力[17] - 合作伙伴案例:GitHub利用Codex SDK成功集成;Cursor团队通过将其Harness与开源的Codex CLI对接,优化了系统性能[18] Codex的发展现状与未来展望 - Codex是增长最快的模型之一,每周服务数十万亿个token,该数字自开发日以来已翻了一番[18] - 未来模型将变得更强大,能处理更长周期的任务且无需监督,对新模型的信任度将进一步提高[18] - 未来重点将是处理庞大代码库和非标准库,支持在闭源环境中工作并匹配现有模板和实践[5][19] - SDK将持续发展,以更好地支持模型能力,使模型能在执行任务中不断学习,并为解决终端问题的Agent提供更多支持[19]
Zed 为什么不用自己造 Agent?OpenAI 架构师给出答案:Codex 重划 IDE × Coding Agent 的分工边界
AI前线· 2026-01-17 14:25
Coding Agent的构成与核心价值 - Coding Agent由三部分组成:用户界面、模型和Harness [3] - 用户界面可以是命令行工具、集成开发环境或云端/后台Agent [3] - 模型可以是GPT-5.1系列或其他供应商模型 [3] - Harness是核心Agent循环,由一系列提示和工具组合而成,作为模型与用户、代码交互的媒介 [3][6] - 将模型与Harness一同开发,能更好地理解模型行为,这是Codex作为集成系统的优势所在 [4][8] - 单纯在模型上构建包装器忽视了基础设施层的整体价值,应将精力集中在让产品脱颖而出的差异化功能上 [4][12] Harness构建的挑战与设计原则 - Harness构建面临多项挑战:处理模型未见过的创新工具、根据模型特点调整提示、管理模型响应延迟、设计用户体验以展示模型思考过程、管理上下文窗口和数据压缩、适应不断变化的API接口 [6] - 将模型适配到Harness需要大量的提示设计,模型的行为可理解为“智能”加上“习惯” [7] - 理解模型的习惯是成为优秀提示工程师的关键,应让模型按照其习惯的方式工作,而非过度引导 [8] - 例如,GPT-5模型若被过度引导查看所有内容,会导致响应速度慢,效果不如预期 [8] Codex系统的功能、集成与用例 - Codex被设计成适用于各种编程环境的Agent,可作为VS Code插件、CLI工具使用,或通过VS Code插件、手机上的ChatGPT在云端调用 [9] - 其基础功能包括:通过提示将想法转化为可运行代码、在代码仓库中导航并编辑文件、执行命令和任务、从Slack或GitHub调用以审查PR [9] - Codex的Harness需要处理复杂任务:并行工具调用、线程合并、安全性(沙箱管理、提示语转发、权限设置、端口管理)、数据压缩和上下文优化 [9] - Codex的应用场景广泛:从整理桌面照片到分析文件夹中大量的CSV文件进行数据分析,只要任务能以命令行及文件任务形式表达,Codex就能执行 [10] - Codex是一个SDK,可通过TypeScript库或Python调用,还提供GitHub动作以自动合并PR冲突,并可添加到AgentSDK中,为产品提供MCP连接器 [12] - 公司可与客户合作,将Codex嵌入到产品中,例如Zed将其嵌入IDE层级,专注于打造最好的代码编辑器,而GitHub等顶级合作伙伴已利用该SDK直接集成Codex [15] 行业趋势与Codex发展前景 - Coding领域是应用人工智能最活跃的前沿之一,新模型不断发布,团队需不断调整Agent以适应新模型 [5] - 未来将是关于庞大代码库和非标准库的时代,模型需支持在闭源环境中工作、匹配现有模板和实践 [4][16] - Codex Max推出后变化迅速,目前是增长最快的模型,每周服务数十万亿个token,该数字自开发日以来已翻一番 [16] - 预计模型将变得更强大,能处理更长周期的任务且无需监督,新模型的信任度将进一步提高,能够处理比六个月前更复杂的工作 [16] - SDK也将不断发展,以更好地支持模型能力,使模型能在执行任务过程中不断学习,避免重复错误,并为写代码和使用终端解决问题的Agent提供更多支持 [16]