Workflow
Codex App
icon
搜索文档
不怕你走,就怕你不用AI写代码,OpenAI Codex负责人亲口承认:内部已很少再打开IDE
36氪· 2026-02-25 13:41
GPT-5.3-Codex产品发布与技术升级 - OpenAI于2月初正式发布最新一代编程智能体GPT-5.3-Codex,这是其在AI编程领域的最新旗舰模型,标志着向“智能体变成实际协作者”路线的重要升级[1] - 新模型在GPT-5.2-Codex基础上进行了全面提升,包括更强的推理能力、更高的效率、更广的工作流支持,并提升了用户交互体验和长期任务处理能力,目标是让智能体像人类同事一样在整个开发流程中协作[1] - 在权威评测中,新版本在多个行业benchmark上表现卓越,例如在软件工程综合评测SWE-Bench Pro和系统操作评测Terminal-Bench2.0上大幅领先前代,在OSWorld和其他能力指标上也表现显著,整体推理速度提升约25%[1] 开发者社区反馈与产品挑战 - 在开发者社区中,GPT-5.3-Codex的反馈呈现两极分化:部分开发者分享了正面经验,如模型在CLI与IDE插件中带来更流畅操作、新版计划模式提供更清晰步骤反馈,这与官方“交互式协作和实时指导”方向一致[2] - 部分用户批评GPT-5.3-Codex尚未通过API向所有开发者开放,部分平台无法直接调用最新模型,导致许多开发者难以在自定义环境中集成[2] - 另一些用户反映新模型在某些编辑器(如Zed)中表现尚不成熟,体验不佳,偶尔中断或无法按预期编辑文件,甚至有人因此回退使用老版本[4] - 还有开发者表示,并不总是能获得“官方宣传的强大师任务表现”,尤其在Web生成等任务上出现停滞,并认为某些竞争模型(如Claude系列)在某些日常任务上体验更顺畅[6] OpenAI内部工作流变革与AI采用程度 - OpenAI内部工作方式在GPT-5.2 Codex发布后发生本质变化:工程师不再“和AI一起写代码”,而是把整个任务直接委托给AI,流程转变为一起制定计划、确认规格,然后放手让它执行[29] - 在OpenAI内部,许多工程师几乎不再打开传统IDE,而是全天候运行Codex,会议期间如果没有让Codex同步处理任务,反而会被认为是浪费时间[8] - OpenAI产品负责人判断,现在公司内部绝大多数代码都是由AI写出来的,工程师的注意力已从实现细节转移到任务拆解、计划评估和结果审查上[8] - OpenAI内部几乎所有代码在推送到主仓库时,都会自动经过Codex的审查,并且公司明确训练过模型进行代码审查,目标是给出高信噪比反馈并减少误报[34] AI对软件工程行业与人才结构的影响 - OpenAI产品负责人否定了“AI会减少工程师数量”的判断,认为未来五年工程师和创造者只会更多,因为历史上“计算机”、“程序员”等词被多次重定义,“软件工程师”正站在下一次重定义的门槛上[6] - 真正发生变化的是人才栈的压缩,在Codex团队内部,传统的前端、后端、基础设施等分工正在迅速模糊,每个人都被要求具备更强的全栈能力,甚至同时参与设计与产品判断[7] - 工程师的角色正在从执行者转变为问题定义者与结果把关者,在某些情况下,产品经理这个角色是否仍然必要都值得重新讨论[7] - 给未来工程师的建议是:构建高质量的东西,一个有思想、有完成度的项目比任何标准化简历都更有说服力,在构建变得容易的时代,主动性、审美和对质量的执念变得稀缺[9][62][63] 产品战略、市场竞争与商业模式 - Codex团队采取反直觉策略:将产品做得尽可能开放,例如其核心执行框架是开源的,并推动建立通用约定(如agents.md文件、agents/目录)以降低用户在不同工具间切换的成本[35][36] - 公司认为决定胜负的关键是算力优势与最好的模型,为了实现这一点,需要成功的商业模式来支撑持续投入,而Codex这种“研究+产品”高度融合的团队会倒逼模型进步更快[40] - 公司衡量Codex成功的核心指标是活跃用户数,目前主要看WAU(周活跃用户),标准是用户是否真的在产品里完成过一次交互,未来DAU(日活跃用户)会更合理[42][43][44] - 公司通过超级碗广告、向免费ChatGPT用户和Go计划用户提供部分Codex功能等策略,大幅扩展了产品的可用性,预期会有一些原本可能使用低代码工具的用户转而使用Codex进行简单构建[49] 技术瓶颈、未来方向与市场终局判断 - 制约AGI发展的一个关键瓶颈是人类验证工作的速度和输入效率,而非模型算力或架构本身,理想状态是使用AI无需琢磨提示词技巧,它应该简单到不费吹灰之力[17][18] - 智能体开发分为三个阶段:首先在软件工程领域做到足够出色;其次开放给探索者,将其能力扩展到非编码任务;最后将验证有效的方案产品化,打造功能专一、开箱即用的产品[22] - 公司认为市场的最终形态将是更少的玩家捕获更多的价值,长期来看,智能体会变成什么都能帮做的超级助手,成为工作的重力中心,员工不会希望公司里有多个不同的智能体[55] - 对于SaaS公司是否会被模型公司取代,公司认为关键在于是否真正拥有与“人”的关系或掌握极其关键的系统记录,拥有这两点的公司不会轻易消失,而只是“胶水层”的公司则更危险[57]
OpenAI Codex App启示录:当代码可以被白领并行生成,软件迎来“通胀时代”
锦秋集· 2026-02-05 23:01
OpenAI Codex App发布的意义与定位 - OpenAI于2026年2月2日发布全新的macOS桌面应用Codex App,定位为构建AI Agent的“指挥中心”[2] - 该应用旨在将用户桌面转变为AI编码与开发智能体的调度中枢,支持并行管理多个智能体、运行长期任务及组织项目线程[2] - 此次发布标志着“白领人群”等普通人也能参与到代码生产革命中,软件行业进入“并行革命”时代[2] 代码生产方式的范式转移 - 软件开发方式从串行变为并行,打破了“人月神话”的约束,一个工程师可同时开启多条独立开发线程[5] - 根据Cursor、Copilot的用户反馈,AI能将开发效率提升30%-50%,而Codex的并行能力可能将效率推得更高[5] - 软件开发方法论从“精心设计的建筑”转向“快速迭代的实验”,软件可能变成“瞬时响应”的服务而非固定产品[5][6] 软件行业价值与稀缺性的重构 - 代码生成成本趋近于零导致软件供给爆炸,但需求未同比增加,单个软件价值被稀释,行业进入“通胀时代”[3][7] - 代码不再稀缺,但判断力、用户需求洞察、审美和品味等能力将升值[8] - 中长期看,市场将自动出清,新的稀缺性将浮现,包括:能被信任的软件、有长期维护承诺的软件、有社区生态支撑的软件、有监管背书的软件[9][10][11] 对SaaS商业模式与估值的冲击 - 面向中小企业(SMB)的工具类SaaS订阅逻辑可能被动摇,标准化功能可能被“按需生成”替代[12] - Skills功能成为“低配版的工具SaaS”,具有定制化、按需、免订阅费的特点,将蚕食工具类SaaS的低端市场[13][14][15][16] - 软件公司的核心资产从“代码库”转向“用户资产”、“数据资产”、“品牌资产”,并购估值逻辑需重写[18][19] 用户与开发者边界的变化 - Codex的Skills功能让非技术人员能创建可复用的能力模块,“用户”和“开发者”身份正在合并[20] - “需求传递链”被压缩,用户可直接向AI描述需求并调整生成结果,产品经理的核心价值转向发现用户未意识到的需求[21][22] - 程序员的价值从代码能力转向AI协作能力,招聘标准需考察将业务需求抽象为可复用模块的能力[23][24][27] 软件开发流程与生态的演变 - 代码审查可能成为新的瓶颈,质量控制体系需重建,项目管理逻辑需按AI线程数和审核能力重写[28][29] - AI生成代码的质量和安全隐患是重要变量,可能催生AI代码审计、安全检测等新的创业机会[30][31] - 开源社区的贡献模式可能改变,稀缺资源从“写代码的人”转向“做决策的人”,项目分叉将变得更容易[32][33][36] 地理套利与市场竞争格局变化 - 软件开发的地理套利逻辑从“人力成本套利”转向“AI效率套利”,外包公司通过AI提升效率进行竞争[37] - 模型厂商如OpenAI亲自下场做应用,挤压中间层工具公司的生存空间,后者需向垂直化、专业化方向发展[43][44] - AI大战是工具能力、模型能力与生态绑定的综合竞争,涉及对开发者心智和产业链定义的争夺[41][45][46][47] 新的创业机会与护城河构建 - Skills可能形成新的分发市场,类似App Store,催生平台型公司及“Skill创作者经济”[38][39][40] - 创业的技术门槛再次降低,但护城河更难建立,竞争焦点转向对需求的独特洞察、独有数据、用户信任及分发渠道[49][50][52] - 当代码生成成本趋近于零,数据和场景变得稀缺,包括:私有数据、实时数据、关系数据、物理世界接口数据、有牌照要求的数据[53][54]
别再死磕IDE了,OpenAI Codex独立App上线,多智能体替你写代码
36氪· 2026-02-03 20:46
AI编程工具形态与竞争格局 - AI编程赛道竞争持续升温,工具形态正从“代码补全”向“多智能体协作”演进 [1] - OpenAI发布Codex独立桌面App,被视为在编码工具领域的一次“防守反击”,旨在应对Google Gemini 3与Anthropic Claude Opus等强劲对手的竞争 [1] - 过去一个月已有超过100万名开发者使用Codex,自GPT-5.2发布以来,其使用量几乎翻倍 [8] Codex App的核心功能与设计理念 - Codex App是一个“代理的指挥中心”,提供聚焦的工作空间,用于统一管理多个AI智能体并支持其并行执行任务 [1] - 每个Codex智能体可连续工作长达30分钟,运行在GPT-5.2-Codex模型之上,在TerminalBench基准测试中位列第一 [1] - 应用内置对git worktree的支持,允许智能体在同一仓库中并行工作而不冲突,开发者可同时探索不同实现路径 [2] - 采用安全优先设计原则,使用原生、开源且可配置的系统级沙箱机制,智能体默认仅能访问受限资源 [6] - 核心理念是一切能力以代码为中心,旨在弥合前沿模型与真实工作场景之间的使用门槛 [10] 从代码生成到任务闭环的能力拓展 - Codex通过Skills(技能)机制拓展能力边界,将指令、资源和脚本打包成可复用技能,以调用外部工具并执行完整工作流 [3] - 官方技能库覆盖从设计到部署的多个环节,例如从Figma获取设计、在Linear管理项目、将应用部署到Cloudflare或Vercel等 [3] - 引入Automations(自动化)机制,允许开发者设定定时任务,让智能体在后台持续运行以处理重复性工作 [5] - 展示案例中,Codex独立完成了一款包含多角色、8张地图的赛车游戏开发,总计消耗了700多万token,扮演了设计师、开发者和测试员多重角色 [4] 实际应用价值与开发者体验 - Codex App能有效处理技术债,例如重构代码、清理历史遗留问题、补齐测试覆盖,AI可不受情绪影响持续工作直至问题解决 [7] - 应用支持开发者直接审查智能体提交的改动,对diff进行评论,并能一键在本地编辑器中打开代码进行人工微调 [2] - 对于已使用Codex CLI或IDE插件的用户,迁移成本低,App会自动继承已有的会话历史和配置 [2] - 目前Codex App已在macOS上线,面向ChatGPT Plus、Pro、Business、Enterprise和Edu用户开放,使用量包含在订阅中,所有付费方案的速率限制将翻倍 [7] 公司战略与未来规划 - OpenAI明确目标是赶在竞争对手扩大影响力前,将Codex打造成AI编程领域的默认工具 [8] - 公司计划推出Windows版本,支持云端触发的Automations,并持续提升模型能力与推理性能 [9] - Codex的演进路径从命令行工具到网页版,再到如今的独立桌面App,是对“智能体编程”市场的关键追赶 [10]