OpenAI推理第一人离职，7年打造了o3/o1/GPT-4/Codex

核心事件 - OpenAI研究副总裁Jerry Tworek于2026年1月6日宣布离职，他在公司任职近七年，是构建o1、GPT-4、ChatGPT及首个AI编程模型Codex的关键人物 [1][21][24] - 离职原因是为了探索一些在OpenAI难以开展的研究领域，并未公布具体去向 [1][24][28] 人物背景与职业经历 - Jerry Tworek拥有华沙大学数学专业硕士学位，具备强理论与数理功底 [9] - 职业生涯早期在阿姆斯特丹从事了五年量化研究，专注于期货市场的量化交易策略，并由此开始研究强化学习 [11][12] - 于2019年加入OpenAI担任研究科学家，当时公司规模尚小，以非营利研究实验室为主 [12] - 早期参与了机器人项目“用机器人手解决魔方”，并在NeurIPS 2019深度强化学习研讨会展示 [13] - 是最早一批参与“大规模预训练+算力扩展”路线的研究者之一，并在GPT-3发布后开始研究评估和训练GPT-3以解决推理和逻辑问题 [14] 在OpenAI的主要贡献与角色演变 - 2019至2022年间，专注于神经程序综合与大模型推理研究，涉及Codex、Copilot等代码大模型，并利用强化学习提升复杂任务的推理与决策能力 [16] - 在DeepMind发布Chinchilla模型之前，就已发现了后来被称为“Chinchilla Scaling Law”的现象 [26] - 是GPT-4的首席研究员，并领导了第一个推理模型o1的研究开发 [18] - 对外被介绍为GPT-5推理机制和长思考能力的核心负责人，并在多个访谈中系统讲解相关技术 [18][19] - 2022年起担任Research Lead，负责团队研究如何让大语言模型使用工具、解决STEM领域困难问题，包括插件和Code Interpreter等 [16] - 2025年升任OpenAI研究副总裁 [20] - 自称组建并壮大了“世界上最强的机器学习团队” [28] 技术理念与影响 - 长期强调对“推理”而不仅仅是“模式匹配式生成”的重视，倾向于将大模型视为可以通过训练“学会思考过程”的系统 [14] - 其工作推动了大语言模型编程革命，并建立了一个新的缩放训练和推理计算范式，即现在通常所称的“推理模型” [25][26] 离职反响与公司文化观察 - 其离职推文获得了大量OpenAI在职人员的积极回应与祝福 [4][6] - 有观察指出，OpenAI员工离职时发表“小作文”可能是一种企业文化或不成文规定 [33][34]