Transformer作者爆料GPT-5.1内幕！OpenAI内部命名规则变乱了

AI发展现状与趋势 - AI发展并未放缓，而是呈现平稳的指数级增长，类似于摩尔定律，其进步由新技术、算力提升和工程优化共同驱动 [13][15][16][17] - 行业底层范式正经历从预训练模型向推理模型的静悄悄但本质性的转换，其意义不亚于Transformer的诞生 [1][2][18][19] - 外界感觉进展变慢的原因包括：预训练处于S曲线上升后期，投入产出比下降；行业重心转向更小、更便宜但质量相当的模型 [19][21] 推理模型的技术特点 - 推理模型的核心在于思维链，即在给出答案前先进行思考，并可使用工具（如浏览网页）以提升答案准确性 [23][27][28] - 训练方式从传统的梯度下降转向强化学习，通过奖励机制和细致的数据准备来优化模型，未来将应用更复杂的强化学习 [29][30] - 多模态推理是下一个突破点，目前仍处于起步阶段，强化学习将助力其进一步提升 [9][32] OpenAI模型迭代策略 - GPT-5.1并非简单的小版本迭代，而是一次巨大的稳定性迭代，改进集中于后训练阶段，如增强安全性、减少幻觉、增加风格选择 [34][36] - 版本命名规则转变为以用户体验为导向，例如GPT-5为基础模型，GPT-5.1为能力更优版本，Mini为更小更快的版本 [38] - 内部采用多项目并行（强化学习、预训练等）再通过蒸馏技术整合的灵活开发模式，大大缩短了模型迭代时间 [38] 模型能力与挑战 - 模型能力实现质的飞跃，例如ChatGPT从直接记忆答案转变为主动推理，Codex已改变程序员的工作流程 [23][24] - GPT-5.1在复杂任务（如奥林匹克竞赛题）上表现优异，但在需要多模态推理和上下文迁移的简单任务（如奇偶数判断）上仍存在明显短板 [41][42] AI未来应用展望 - AI不会让人类完全失去工作，高风险、高关注度场景仍将依赖人类专家，但基础工作的可替代性将提高，工作内容将发生变化 [10][62][65][66] - 家用机器人被视为继ChatGPT之后最直观的AI革命，其进展取决于多模态能力、通用强化学习和物理世界推理的突破 [11][67][69] Transformer与OpenAI背景 - Transformer的八位共同作者从未在同一物理房间共同工作，当时业界对单一模型处理多任务的想法普遍不理解 [50][51] - OpenAI内部组织架构灵活，根据项目自发组队，但存在GPU资源竞争，预训练消耗资源最多，其次是强化学习和视频模型 [55][56][57]