Workflow
OpenAI的“新突破”:通用验证器
虎嗅·2025-08-05 15:04

核心技术机制 - OpenAI正在开发名为“通用验证器”的新技术,该技术采用“证明者-验证者游戏”的内部对抗训练框架,通过让一个AI模型(验证者)检查评判另一个模型(证明者)的输出来系统性提升模型质量[2][3] - 该框架包含两种角色:“证明者”模型负责生成答案,“验证者”模型负责区分答案正误并通过反馈优化证明者,其规模足够小适合大规模部署并为未来GPT部署设计[4][6] - 技术机制类似于生成对抗网络,通过内部对抗解决强化学习在创意写作、数学证明等主观或复杂领域难以验证答案质量的瓶颈[2][5] 技术价值与进展 - 该技术是“通用的”,能显著提升大模型在难以验证任务上的表现,标志着公司正试图攻克AI商业化应用中的核心痛点——可信度[2] - 技术已帮助OpenAI模型在软件编程和创意写作等领域取得进步,例如在复杂数学证明中确保每一步逻辑一致,公司模型近期在国际数学奥林匹克竞赛的突破性成绩很可能得益于此技术[13] - OpenAI高级研究员表示其强化学习方法是“通用目的”的,可验证更主观类别的答案质量,研究员Noam Brown也间接证实了方法的有效性[2][13] 公司背景与整合 - 该关键技术被视为OpenAI前“超级对齐”团队的技术遗产,由联合创始人Ilya Sutskever主导成立,团队解散后其技术成果已被整合进公司核心产品研发路径[9][10][11] - 技术正被应用于GPT-5开发过程,曾在GPT-4代码辅助功能试点的模型自我批判系统已被正式整合进GPT-5这个“下一个主线模型”[12] 行业竞争与预期 - 包括xAI和谷歌在内的竞争对手已将强化学习作为提升模型能力的关键技术路径并加倍投入,在此背景下“通用验证器”被视为公司在白热化AI竞赛中保持领先优势的核心资产[12] - OpenAI首席执行官Sam Altman为GPT-5造势,称其“在几乎所有方面都比我们更聪明”,加剧了市场对GPT-5的高度期望[12]