文章核心观点 - OpenAI 正在进行重大的战略聚焦,暂停了视频生成模型 Sora 等“分叉”项目,将公司最宝贵的算力、产品和组织资源集中投入到其认定的、最接近通用人工智能(AGI)的路径上,即构建一个能够理解用户、代表用户、操作电脑并接管工作流的“超级应用”[2] - 该“超级应用”旨在成为承接 AGI 能力的总入口,其核心是将编码、浏览器操作和 ChatGPT 的能力整合在一起,形成一个统一的 AI 层,让计算机适应人,而非人适应机器[2][12] - 公司认为,文本模型(GPT Reasoning)是通向 AGI 的清晰路径,并且已经能够“看见终点”,而算力短缺是当前产品上线、能力释放和商业规模的核心约束,整个行业将在今年感受到算力紧缺的压力[2][3][9] 战略聚焦与资源分配 - 公司主动收缩战线,将资源从视频生成等方向转向“超级应用”和 GPT 推理模型的开发,因为 Sora 和 GPT Reasoning 属于不同的技术分支,在算力有限的情况下无法同时做到极致[2][7] - 这一转变是基于对技术成熟度的认可,公司已确信技术可行,现阶段需要进入真实世界,通过用户在知识工作等场景的实际使用来获得反馈,而非停留在基准测试[5] - 在内部优先级排序中,能理解目标、与用户对齐的个人助理,以及能解决复杂问题的 AI 排在首位,仅满足这两项需求的算力已然不足[6] - 公司并未完全放弃 Sora 的研究,但其更多被置于机器人技术的语境中,而该领域目前仍偏研究阶段[8] 超级应用(Super App)的愿景与规划 - “超级应用”是一个整合了编码、浏览器和 ChatGPT 功能的“终端应用”,目标是让用户直接体验 AGI 的能力,其本质是“使用计算机本身”,让 AI 来适应人[12][13] - 该应用将同时面向个人用户和企业用户,是用户连接数字世界的个人化接口[14] - 应用的核心进化在于“记忆”和“上下文”能力,未来的 AI 将能记住用户的所有互动,并接入邮箱、日历等,真正帮助用户实现目标[15] - 该应用将分阶段推出,其起点是 Codex,公司计划首先让 Codex 在“通用知识工作”上变得更好用,后续再逐步深化[16] 技术路径与 AGI 进展 - 公司坚信基于文本的 GPT 推理模型是通向 AGI 的正确路径,并且已经看到了明确的证据,今年还将有更强的模型发布[9] - 一个关键的认知是,许多看似不同的应用(如语音、图像、文本、编码、科学发现)可以在同一个技术框架(GPT 架构)内实现,公司正致力于将技术收敛统一[11] - 公司总裁 Greg Brockman 量化了 AGI 的进展,认为当前已达到目标的 70% 到 80%,并预计未来几年内将迎来 AGI,届时 AI 将能胜任几乎所有依托计算机完成的智力任务[35] - 技术进步正进入“起飞”的加速阶段,这不仅是模型能力的指数级增强,也包括用 AI 来改进 AI 研发过程,以及整个生态系统的共同推动[27][28] 模型发展路线图与能力跃迁 - 即将发布的新模型(如 Spud)是一个新的基础模型,凝聚了约两年的研究积累,它将带来整体能力的提升,表现为能解决更难的问题、更细腻地理解指令和上下文[23][25] - 模型能力的提升存在“跳跃式”特征,例如从能完成 20% 的任务跃迁到能完成 80%,这种质变使得 AI 从“有点用的工具”变为必须围绕其重构工作流的必需品[37][38] - 能力跃迁源于更强的基础模型以及多个维度的同时推进,这种提升仍在持续,预计相关能力在一年内将变得极其可靠[38] - 公司的发展模式是构建一个持续加速的“进化引擎”,而非依赖单次发布[24] 算力战略与商业模式 - 公司将算力视为“收入中心”而非“成本中心”,其逻辑类似于雇佣销售人员:只要产品可销售且需求存在,更多的算力就能带来更高的收入[57] - 当前全球算力供不应求,这制约了哪些产品能够上线以及能力的分配,世界上没有足够的算力让每个人都拥有运行中的个人 Agent[3][57] - 公司对未来算力需求有清晰预判,并提前 18-24 个月进行采购决策,历史经验证明其需求预测始终成立[58] - 收入模式将不会在消费者和企业之间做清晰割裂,核心是用户及其通往数字世界的入口(如超级应用),营收将来源于此[60] 竞争格局与产品化思路 - 面对 Anthropic 等竞争对手在“超级应用”形态上的布局,公司承认曾在编码工具的“最后一公里”可用性上投入不足,但自去年年中已组建专门团队补课,目前已经追上甚至在某些方面更受用户偏好[18] - 公司产品开发思路发生重要转变:从“先做模型,再做产品”转变为从一开始就将研究作为完整产品来设计,并考虑其最终如何使用[19] - 竞争加剧反而加强了公司内部的战略对齐和统一感,促使研究(Research)与部署(Deployment)更紧密地融合[21] Agent(智能体)的影响与人类角色 - AI 正在从“写代码”向“解决问题”的本质演变,其核心能力是理解上下文、管理工具集成,这将使 AI 从程序员工具转变为所有人的工具,应用于 Excel、PPT 等各种重复性操作[39][40] - 在 Agent 时代,人类用户的角色将越来越像“管理者”,负责设定目标、分配任务和监督结果,而不能将判断和问责完全外包给 AI[3][43] - 使用 Agent 时需在建立信任的基础上,有选择地放开低层细节,但同时必须理解系统的能力边界和风险,不能失去对问题的感知[45] - 技术的普及将“民主化”创业,让更多人能借助 AI 启动和运营业务,并不断抬高人类能解决的问题上限[47] 市场认知与社会接受度 - AI 在公众中受欢迎度不高的部分原因在于,流行文化中的负面叙事以及未能向大众清晰传达 AI 对个人生活的具体益处[67] - 调查显示,仅“听说过”而从未使用过 AI 的人态度更负面,而真正使用过的人评价通常更正面[75] - 公司认为,让公众建立“掌控感”至关重要,建议人们亲自尝试使用 AI 工具,带着好奇心将其融入工作流程,思考如何利用技术实现个人目标[75][76]
不会写代码也能用 AI 干活了:OpenAI 正在做一个“替你用电脑”的 Super App,新模型Spud 几周内登场
AI前线·2026-04-04 13:32