田渊栋的2025年终总结:关于被裁和26年的研究方向
自动驾驶之心·2026-01-06 08:28
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 >>自动驾驶前沿信息获取 → 自动驾驶之心知识星球 本文只做学术分享,如有侵权,联系删文 最近太忙,只能把年终总结放到1月1日之后再写了,不管怎样,能开始动笔就是好事。 作者 | 田渊栋@知乎 编辑 | 大模型之心Tech 原文链接: https://zhuanlan.zhihu.com/p/1990809161458540818 关于被裁 在2025年1月底被要求加入Llama4救火的时候,作为一直以来做强化学习的人,我事先画了一个2x2的回报矩阵(reward matrix),计算了一下以下四种可能(虽然在 那时,因为来自上面的巨大压力,不同意是几乎不可能的): | | 同意帮忙 | 拒绝帮忙 | | --- | --- | --- | | Llama4项目成功 | 成为英雄 | 被边缘化 | | Llama4项目未成功 | 为公司尽力 | 被人骂在公司需要时不出力 | 当时想的是我们去帮忙的话,即便最后项目未能成功,也至少尽力而为,问心无愧。不过遗憾的是,最后发生的是没在计算之内的第五种可能,这也让我对 ...