田渊栋的2025年终总结：关于被裁和26年的研究方向

文章核心观点 - 文章是一位资深AI研究员对个人职业变动与年度研究方向的回顾与总结其核心观点在于强调大模型推理效率提升与模型可解释性研究是当前及未来人工智能领域两个至关重要且充满前景的方向同时分享了个人从大公司离职加入初创企业的职业选择 [3][5][6][10] 个人职业变动与感悟 - 作者于2025年1月底被要求加入Llama4项目进行“救火” 尽管项目最终结果超出其最初设想的四种可能但在此过程中团队在强化学习训练的核心问题上进行了多项有价值的探索 [3] - 作者在Meta工作十年多后最终离职尽管此前因经济和家庭原因多次犹豫但最终将此次变动视为一个积极的转折点并决定加入一家初创公司担任联合创始人 [4][5] - 作者回顾了2021年的一项工作该工作起初未受关注但后来在ICML会议上获得了最佳论文荣誉提名并成为表征学习领域一篇较知名的文章 [5] 大模型推理研究方向 - 连续隐空间推理：作者团队在2024年末公开的连续隐空间推理工作（COLM‘25）在2025年引发研究热潮随后团队在2025年上半年发表了一篇理论分析文章（NeurIPS‘25）阐述了该方法的优势所在 [6] - 推理效率提升：团队通过多项研究致力于提高大模型推理效率 - Token Assorted（ICLR‘25）：通过VQVAE学习隐空间的离散token 并将其与文本token混合进行后训练在降低推理代价的同时提升了性能 [7] - DeepConf：通过检测生成token的置信度来决定是否提前终止推理路径从而显著减少推理所用token数量在多数投票场景下性能更优 [7] - ThreadWeaver：通过制造并行推理的思维链并进行后训练来加快推理速度 [7] - 其他尝试：包括在dLLM上用强化学习训练推理模型以及在小模型上学习推理 [7] 模型可解释性研究方向 - 关注动机：作者认为无论人工智能通过规模扩展最终成功或失败可解释性研究都至关重要是确保AI向善或寻找替代方案的关键且人类探索的天性也驱使其研究“黑盒” [10] - Grokking（顿悟）现象：作者团队通过分析Grokking这一从记忆到泛化的特征涌现现象来探索模型学习的表征与数据结构的关联 2024年的初步工作（NeurIPS‘25）后近期在可证明的缩放定律研究上取得较大突破 [8] - RL与SFT行为差异：作者团队年末的工作从权重层面解释了强化学习与监督微调行为不一致的原因指出SFT因使用非当前策略数据导致权重主分量被大幅修改引发灾难性遗忘而RL使用当前策略数据主要改变权重次要分量避免了该问题 [9] - 研究现状与愿景：作者指出当前通过寻找“电路”来打开模型黑箱仍处于初步阶段真正的挑战在于从第一性原理解释模型为何会涌现出解耦、稀疏、模块化等特征其愿景是实现从“收集证据”到“推导原理”的范式转变最终指导下一代模型设计 [11]