经验时代（Age of Experience） - 财报，业绩电话会，研报，新闻

经验时代（Age of Experience）

搜索文档

DeepMind强化学习掌门人David Silver离职创业，Alpha系列AI缔造者，哈萨比斯左膀右臂

36氪· 2026-02-02 16:21

核心人事变动 - 强化学习领域权威专家、DeepMind元老级研究员David Silver已离职，结束了在该公司长达15年的职业生涯 [1] - 其离职已得到Google DeepMind发言人证实，公司对其贡献表示感谢 [5] - 在正式离职前的几个月，David Silver一直处于休假状态 [2] 新公司创立与规划 - David Silver创立了一家名为Ineffable Intelligence的新AI公司 [1] - 该公司早在2025年11月就已成立，并于2026年1月16日正式任命Silver为董事 [2] - 公司总部设在伦敦，目前正处于积极招募AI研究人才和寻求风险投资的阶段 [3] 创始人的背景与成就 - David Silver于2010年DeepMind成立之初便加入，是公司的核心创始成员之一，与CEO Demis Hassabis是大学好友并曾共同创业 [7] - 作为强化学习团队负责人，他主导或深度参与了DeepMind几乎所有里程碑项目，是“Alpha系列”AI的主要缔造者 [7] - 其代表性成就包括：领导开发击败围棋世界冠军李世石的AlphaGo（2016年）[9]、开发不依赖人类棋谱的AlphaZero [9]、开发不被告知规则即可掌握多种游戏的MuZero [9]、领导开发击败《星际争霸II》顶尖玩家的AlphaStar [9]、参与开发能解答国际数学奥林匹克竞赛题目的AlphaProof [9] 以及是Google首个Gemini系列AI模型研究论文的作者之一 [9] - 其学术影响力巨大，是DeepMind发表论文最多的员工之一，谷歌学术统计其论文被引用超过28万次，h-index高达104 [11] - 凭借卓越贡献，他获得了2019年度ACM计算奖和2017年度英国皇家工程院银质奖章等多项荣誉 [10] 新公司的技术愿景与方向 - 创始人离职创业的动机是希望回归“解决AI领域最难题所带来的敬畏与奇迹”，并将实现超级智能视为当前最大的未解挑战 [17] - 公司的核心目标是构建一个能够自我发现所有知识基础、永无止境学习的超级智能 [17] - 创始人对当前主流大语言模型（LLM）提出看法，认为其能力受限于人类已有的知识，因为LLM本质是从人类产出的文本中学习 [17] - 他倡导AI进入“经验时代”，即AI系统应通过强化学习从经验中自我学习，从而发现人类未知的新事物 [19] - 其理念是希望AI摆脱对人类知识和直觉的依赖，从第一性原理出发进行学习，并以AlphaGo对战李世石时走出令所有人类专家误判但最终制胜的第37手棋作为经典例证 [19] 创始人的其他职务 - 除了在DeepMind的工作，David Silver同时担任伦敦大学学院的教授，并且他将继续保持这一职务 [5]

强化学习

超级智能

经验时代（Age of Experience）

Artificial Intelligence

经验时代（Age of Experience）

Artificial Intelligence

AlphaGo

AlphaZero

DeepMind强化学习掌门人David Silver离职创业！Alpha系列AI缔造者，哈萨比斯左膀右臂

量子位· 2026-01-31 09:34

核心人物动态 - 强化学习领域权威专家David Silver已从DeepMind离职，结束了在该公司长达15年的职业生涯 [1][2] - 其离职后创立了一家名为Ineffable Intelligence的新AI公司，该公司已于2025年11月注册成立，Silver于2026年1月16日正式出任公司董事 [2][3] - 新公司总部位于伦敦，目前正处于积极招募研究人才和寻求风险投资的阶段 [7] 人物背景与成就 - David Silver是DeepMind的元老级研究员，于2010年公司创立之初加入，与联合创始人Demis Hassabis是大学好友并曾共同创业 [12] - 作为强化学习团队负责人，他主导或深度参与了DeepMind几乎所有里程碑项目，是“Alpha系列”AI的核心缔造者 [12] - 其代表性成就包括：2016年领导开发击败围棋冠军李世石的AlphaGo [14]；开发出在不依赖人类棋谱情况下精通围棋、国际象棋和日本将棋的AlphaZero [14]；开发出无需知晓规则即可掌握多种游戏的MuZero [15]；开发出击败《星际争霸II》顶尖职业选手的AlphaStar [16]；近期参与了可解答国际数学奥林匹克竞赛题目的AlphaProof以及谷歌首个Gemini模型的研究 [17] - 其学术影响力巨大，是DeepMind发表论文最多的研究员之一，谷歌学术统计其论文总被引次数超过28万次，h-index高达104 [19] 创业动机与理念 - 创业动机是希望回归“解决AI领域最难题所带来的敬畏与奇迹”，并将实现超级智能视为当前最大的未解挑战 [20] - 其目标是构建一个能够自我发现所有知识基础、并能永无止境学习的超级智能 [21] - 他认为当前主流的大语言模型能力受限于人类已有知识，倡导AI进入“经验时代”，即通过强化学习从经验中自我学习，从而发现人类未知的新事物 [22][24] - 他强调实现真正的超级智能，AI必须摆脱对人类知识和直觉的依赖，从第一性原理出发进行学习，并以AlphaGo对战李世石时超出人类专家理解的第37手棋为例证 [24][25]

强化学习

超级智能

经验时代（Age of Experience）

Artificial Intelligence

经验时代（Age of Experience）

Artificial Intelligence

AlphaGo

AlphaZero