AlphaGo
搜索文档
AI大神10亿美元创业,不走寻常路
搜狐财经· 2026-02-21 15:38
公司融资与估值 - 英国AI研究学者David Silver为其初创公司Ineffable Intelligence筹集10亿美元种子轮融资[1] - 该轮融资由红杉资本领投 若最终敲定将成为欧洲史上规模最大的初创公司种子轮融资[1] - 公司当前估值约为40亿美元 相关条款仍在谈判中可能随时改动[3] 创始人背景与行业影响 - 创始人David Silver职业生涯传奇 十年前主导开发了击败围棋冠军的AlphaGo和击败《星际争霸》顶尖玩家的AlphaStar[3] - 其于2014年谷歌收购DeepMind后 成为Gemini等模型发展的关键推手[3] - 创始人于去年底从谷歌DeepMind离职 立即引发了风投机构的激烈竞争[3] 技术路径与战略方向 - 公司计划绕过大语言模型 直接通过强化学习训练AI 最终目标是创造“超级智能”[3] 投资者反应与竞争态势 - 红杉资本合伙人在创始人离职后不久即意图会面 英伟达、谷歌和微软等互联网巨头也意图参与投资[3] - 当前融资规模体现出投资人乐于看见行业顶尖人才单飞创业[3]
从AlphaGo到DeepSeek R1,推理的未来将走向何方?
机器之心· 2026-02-20 07:43
文章核心观点 - 人工智能正从模仿语言的统计机器,迈向能够进行系统性思考的理解与逻辑操纵系统,这标志着人类社会生产力、组织形态乃至权力结构将面临重构[1] - 机器现已相当擅长编程和思考,通用思考机器能够使用计算机解决几乎任何短周期的数字化问题,这正在开启一个几乎所有计算机科学问题都变得可处理的黄金时代[4][9][13] - 以DeepSeek-R1为代表的新一代推理模型,通过结合强大的基座模型、在线策略强化学习和基于规则的奖励等关键条件,成功实现了推理能力的规模化,其范式已变得相当简单且强大[31][32][38] - 自动化研究和思考将引爆对推理算力的天文级需求,其规模将远超当前水平,并成为未来生产力的核心驱动力[43][44] 人工智能能力演进:从编程到通用思考 - 现代编程智能体(如Claude Code)已能完全替代人类手动编写代码,具备从零实现复杂项目(如AlphaGo、完整网页浏览器)、运行研究实验、优化自身代码乃至尝试证明未解数学问题的能力[5][10][11][12][13] - 这些智能体的优秀调试和问题解决能力源自其推理能力,进而解锁了执着追求目标的能力,使得代码REPL智能体被迅速采用[13] - 进步速度是关键,编程助手将很快强大到可以毫不费力地生成任何数字系统,工程师只需指令AI即可完整复刻一家SaaS公司的所有前端、后端、API和服务[15] 推理的技术本质与发展路径 - 推理可分为演绎推理(从前提必然推导结论)和归纳推理(做出概率性判断),但纯粹的符号推理或贝叶斯网络在现实世界中面临计算成本高、不确定性传播导致结果模糊等问题[18][19][20] - AlphaGo是早期成功结合演绎搜索与深度学习归纳推理的系统,但其应用高度依赖于围棋简单固定的规则集,无法直接应用于语言等模糊领域[22][23][24] - 大语言模型的推理能力发展经历了几个阶段:2022年思维链提示的出现是早期突破;2023年的提示词工程被证明无法让模型从根本上变聪明;2024年初结合树搜索的方法未成主流,瓶颈始终在于模型内部的推理电路本身[26][27][28][29] 新一代推理模型(如DeepSeek-R1)的成功范式 - 核心逻辑简单:从一个强大的基座模型开始,使用在线策略强化学习,针对基于规则的奖励(如数学题、编程测试套件)进行优化,同时设定格式奖励以确保推理过程规范化[31][38] - 该方案成功需要四个关键条件:1) 足够强大的基座模型以采样连贯推理轨迹;2) 使用在线策略RL而非仅监督微调,以在紧密反馈循环中强化“幸运电路”;3) 使用基于规则的奖励而非人类反馈训练的奖励模型;4) 推理算力必须扩大规模以支撑大量长上下文采样[33][34][35] - 一个关键启示是:一个算法在弱初始状态下不起作用,并不意味着在强初始状态下也会得到相同的结果[36] 推理的未来发展方向与行业影响 - 算法仍有简化空间,随着“会思考的LLM”普及,过程奖励模型和基于推理序列的教师强制方法可能卷土重来[40] - 序列化推理计算可能不局限于自回归Token生成,未来可能出现在单次前向传播的各层之间,架构设计可能模糊前向传播、反向传播、自回归解码和离散扩散之间的界限[40][41] - 自动化研究将很快成为高产实验室的标准工作流,使用AI智能体的研究员其生产力将远超手动工作者,“每FLOP的信息增益”极高[43] - 现代编程智能体在教学和沟通方面意义深远,未来每个代码库都可能拥有帮助贡献者快速上手的智能教学命令[43] - 自动化思考将引爆对推理算力的天文级需求,其规模将比当前使用ChatGPT的算力高出好几个数量级,为了满足所有数字愿望将面临巨大的算力短缺[43][44]
马斯克 vs 哈萨比斯 vs 杨立昆:谁定义的才是AI的真实未来?
36氪· 2026-02-09 20:51
关于AGI实现时间与路径的核心观点分歧 - 科技圈对AGI的实现时间、路径和影响存在显著分歧,主要分为激进派、渐进派和降温派三大阵营 [2] 激进派观点:AGI近在眼前,主张快速发展 - 代表人物埃隆·马斯克预测2026年底实现AGI,2030-2031年集体智能超越人类,其依据是AI能力每7个月翻倍,当前模型效率仍有100倍提升空间 [1][3] - 代表人物Anthropic CEO达里奥·阿莫迪也认为AGI将在短期内落地,虽在2026年达沃斯论坛上略微推迟时间预期,但整体态度乐观 [3] - 激进派认为安全措施不应过度阻碍创新,主张在发展中解决安全问题,并认为延迟落地可能导致人类失去对AI的控制权 [4] - 在效率影响上,达里奥·阿莫迪预测AI将在1年内替代所有软件开发者,5年内替代50%的白领工作;埃隆·马斯克则认为2026年AGI落地后,3-7年内一半的岗位将消失 [6] - Anthropic的产品Claude Opus在编程任务上表现突出,在SWE-bench基准测试中准确率达72.5%,在TerminalBench测试中准确率为43.2%,已具备替代部分软件工程师的潜力 [6] 渐进派观点:理性审慎,平衡创新与安全 - 代表人物包括DeepMind CEO戴密斯·哈萨比斯、OpenAI联合创始人伊尔亚·苏茨克维和“AI教父”杰弗里·辛顿,他们是当前AI领域的主流派别 [10][11] - 对AGI定义更严格,强调需具备人类所有认知能力,包括自主提出科学猜想和跨领域创新的能力,并认为与物理世界的交互和理解是关键 [12] - 对AGI落地时间更谨慎,戴密斯·哈萨比斯认为2030年前AGI落地概率仅50%,并指出多模态模型是形成完整世界认知、通往AGI的必经之路 [12][13] - 伊尔亚·苏茨克维的预测有所变化,从2025年预测“5-10年实现AGI”调整为2026年认为需要构建“通用学习直觉”的新范式 [13] - 在监管上主张“主动安全约束”,推动将安全机制嵌入模型训练全流程,例如杰弗里·辛顿提出“电路断路器”与全球暂停协议,戴密斯·哈萨比斯强调需完成至少3轮全场景安全测试 [14] - 在效率价值上持“AI辅助论”,认为AI核心价值是增强人类智能、释放人类创造力,而非替代人类,并认可AI落地存在“效率幻觉” [15][16] 降温派观点:警惕过度炒作,认为AGI遥不可及 - 代表人物是前Meta首席AI科学家杨立昆,核心观点是当前AI技术存在本质短板,AGI短期内无法实现,行业过度炒作 [16] - 彻底否定当前大语言模型技术路径实现AGI的可能性,认为“大语言模型永无AGI”,主张用“高级机器智能”替代AGI概念,新范式落地需数十年 [18] - 认为当前AI安全担忧被过度炒作,监管过于严苛,过度约束会阻碍正常技术研发,但其核心逻辑是“风险尚未显现”而非“收益大于风险” [19] - 认为AI的效率价值被过度高估,指出“效率幻觉”是技术能力不足的体现,例如一项研究显示AI错误导致人类修正成本约占预期价值的40%,某案例中采用AI代码工具后净效率反而下降10% [20] - 即使技术发展,也认为AI不可能完全替代人类劳动,对替代观点持彻底否定态度 [20] 行业共识与技术发展趋势 - 三大派别均认为纯文本大语言模型无法实现AGI,构建理解物理世界因果关系的“世界模型”是必经之路 [21] - 2026年被视为AI从“规模驱动”向“范式重构”的转折节点,多模态模型或成为核心技术 [21] - 尽管对AGI落地时间(1年至20年以上)和路径分歧巨大,但AI发展动态多变,未来可能以超预期方式变革 [21] 相关公司与市场动态 - 埃隆·马斯克正在推动将自己麾下的一系列企业整合上市 [8] - Anthropic正寻求以3500亿美元估值融资,计划筹集总额250亿美元或更多资金,红杉资本计划对其重大投资,微软与英伟达已承诺向其投资总计至多150亿美元 [8]
为什么AI打桥牌赢不了人类?|荐书
第一财经· 2026-02-04 22:15
人工智能在游戏领域的发展与局限 - 核心观点:人工智能在多种复杂智力游戏中已超越人类,但其发展过程与局限揭示了人类智能的独特性,AI的价值在于帮助人类认识自身而非取代[5][6] - 2016年AlphaGo以4比1击败围棋世界冠军李世石,标志着AI在高度复杂智力领域首次超越人类,并导致该冠军三年后隐退[5] - AI攻克国际跳棋依赖“暴力计算+残局数据库”的组合,击败了称霸40年的人类冠军;而AlphaGo则通过蒙特卡洛树搜索与深度学习,在自我对弈4000局后发现了超越人类定式的创新招法[5] - 在七种游戏中,桥牌是唯一“人类玩法仍优于AI”的存在,因其涉及团队协作、信息隐藏和心理博弈,AI难以复制人类对“非语言信号”(如微小停顿)的理解[6] 住房与社会变迁的关联 - 核心观点:住房状况与室内装饰选择深刻反映并受制于经济、政治和社会变迁,住房稳定是一种特权,相关讨论旨在为所有人争取居住权利[8][9][10] - 作者作为移民后代,25岁前住过20多栋不同房子,其个人经历成为观察室内设计、社区与国家关系的典型案例[8] - 社会动荡时期家庭倾向选择平滑的灰色调,疫情期间人们会在墙上画拱门营造外出幻象,女性主义商品化则推动了“千禧粉”成为流行墙色[8] - 英国目前有840万人居住在房租过高、有安全隐患或不适宜居住的房屋中,凸显了住房问题的严峻性[9] - 书籍讨论了薄墙壁对精神状态的影响、视讯门铃背后的商机与安全感缺失,以及城市生活中对绿色植物(如龟背竹)的痴迷作为对污染问题的小规模反击[9] 观鸟活动所反映的人类行为与矛盾 - 核心观点:“观鸟大年”这项极限竞技活动,展现了人类为所爱之事极致探索的共性,同时也揭示了活动内在的竞争性与观鸟本质的宁静快乐之间的悖论,以及气候异常与纪录成就之间的唏嘘关联[13][15] - “观鸟大年”是北美一项无裁判、无奖金的极限挑战,规则简单但代价昂贵,参与者需在一年内在美加地区记录尽可能多的野生鸟类[13] - 1998年厄尔尼诺现象引发的极端气候导致反常鸟类出现,促使三位平均年龄近60岁、背景迥异的参与者(承包商、退休高管、码农)展开了横跨大陆的激烈竞赛[13] - 作者作为普利策奖记者,通过数百小时访谈及参与者日志、笔记等资料还原了该年度故事[14] - 译者指出,人类赋予观鸟竞技性与活动本身的恬静快乐相悖,书中提及的诱拍、侵扰鸟类等行为存在争议,且因气象灾害成就的观鸟纪录令人唏嘘[15] - 书中北美参与者苦苦追寻的八哥、麻雀和白鹭,在译者所在地是日常可见的鸟类,体现了地域差异带来的认知不同[15]
为什么AI打桥牌赢不了人类?|荐书
第一财经· 2026-02-04 13:52
AI在游戏领域的发展与突破 - 游戏被视为AI发展的核心,AI通过在复杂智力游戏中击败人类顶尖选手,标志着其在高度复杂智力领域的突破[1][2] - 2016年3月,AlphaGo以4比1的总比分击败围棋世界冠军李世石,此举彻底改变了围棋领域人类智力至上的传统观念[2] - AI在国际跳棋的突破始于“暴力计算+残局数据库”的组合,其代表程序“奇努克”通过穷举与存储棋位,击败了称霸棋坛40年的人类冠军马里恩·廷斯利[3] - AlphaGo的胜利不依赖人类围棋定式,而是通过蒙特卡洛树搜索与深度学习,在自我对弈4000局后发现了令职业九段惊叹的新颖招法[3] - 在七种被深入研究的游戏中,桥牌是目前唯一“人类玩法仍优于AI”的领域,因其涉及团队协作、信息隐藏和心理博弈,这些“人性鸿沟”是AI难以跨越的[5] 住房与社会议题的关联 - 住房的内饰选择反映了社会经济与政治变化,例如在动荡时期家庭倾向于选择平滑的灰色调,而“千禧粉”的流行则与女性主义商品化进入主流社会相关[7] - 根据英国全国住房联合会数据,英国有840万人居住在房租过高、有安全隐患或不适宜居住的房屋中,凸显了住房不稳定的社会问题[8] - 城市生活中绿色空间和清洁空气的缺乏,导致了千禧一代对室内植物(如龟背竹)的痴迷,这被视为对环境污染问题最小规模的反击[8] 观鸟活动的文化与社会现象 - “观鸟大年”是北美一项无裁判、奖金和奖牌的极限挑战,参与者需在一年内在墨西哥以北地区记录尽可能多的野生鸟类,活动代价昂贵[10] - 1998年厄尔尼诺现象引发的极端气候导致反常鸟类出现,促使三位平均年龄近六十岁、背景迥异的参与者展开了横跨大陆的激烈观鸟竞赛[10] - 人类为观鸟活动赋予的竞技性,有时与活动本身带来的恬然宁静感受相悖,并可能引发侵扰鸟类的争议行为,同时因气象灾害成就的观鸟纪录也令人唏嘘[11]
DeepMind强化学习掌门人David Silver离职创业,Alpha系列AI缔造者,哈萨比斯左膀右臂
36氪· 2026-02-02 16:21
核心人事变动 - 强化学习领域权威专家、DeepMind元老级研究员David Silver已离职,结束了在该公司长达15年的职业生涯 [1] - 其离职已得到Google DeepMind发言人证实,公司对其贡献表示感谢 [5] - 在正式离职前的几个月,David Silver一直处于休假状态 [2] 新公司创立与规划 - David Silver创立了一家名为Ineffable Intelligence的新AI公司 [1] - 该公司早在2025年11月就已成立,并于2026年1月16日正式任命Silver为董事 [2] - 公司总部设在伦敦,目前正处于积极招募AI研究人才和寻求风险投资的阶段 [3] 创始人的背景与成就 - David Silver于2010年DeepMind成立之初便加入,是公司的核心创始成员之一,与CEO Demis Hassabis是大学好友并曾共同创业 [7] - 作为强化学习团队负责人,他主导或深度参与了DeepMind几乎所有里程碑项目,是“Alpha系列”AI的主要缔造者 [7] - 其代表性成就包括:领导开发击败围棋世界冠军李世石的AlphaGo(2016年)[9]、开发不依赖人类棋谱的AlphaZero [9]、开发不被告知规则即可掌握多种游戏的MuZero [9]、领导开发击败《星际争霸II》顶尖玩家的AlphaStar [9]、参与开发能解答国际数学奥林匹克竞赛题目的AlphaProof [9] 以及是Google首个Gemini系列AI模型研究论文的作者之一 [9] - 其学术影响力巨大,是DeepMind发表论文最多的员工之一,谷歌学术统计其论文被引用超过28万次,h-index高达104 [11] - 凭借卓越贡献,他获得了2019年度ACM计算奖和2017年度英国皇家工程院银质奖章等多项荣誉 [10] 新公司的技术愿景与方向 - 创始人离职创业的动机是希望回归“解决AI领域最难题所带来的敬畏与奇迹”,并将实现超级智能视为当前最大的未解挑战 [17] - 公司的核心目标是构建一个能够自我发现所有知识基础、永无止境学习的超级智能 [17] - 创始人对当前主流大语言模型(LLM)提出看法,认为其能力受限于人类已有的知识,因为LLM本质是从人类产出的文本中学习 [17] - 他倡导AI进入“经验时代”,即AI系统应通过强化学习从经验中自我学习,从而发现人类未知的新事物 [19] - 其理念是希望AI摆脱对人类知识和直觉的依赖,从第一性原理出发进行学习,并以AlphaGo对战李世石时走出令所有人类专家误判但最终制胜的第37手棋作为经典例证 [19] 创始人的其他职务 - 除了在DeepMind的工作,David Silver同时担任伦敦大学学院的教授,并且他将继续保持这一职务 [5]
深度|谷歌DeepMind CEO:中国在AI技术能否实现重大突破尚未验证,发明新东西比复制难一百倍
搜狐财经· 2026-02-02 15:26
公司战略与组织架构 - Google DeepMind是Google所有AI研究的整合实体,汇集了Google Research、Google Brain和DeepMind,作为公司的“发动机室”负责所有AI技术的研发,然后扩散到各个产品中[41] - 公司内部进行了大规模重组,将所有AI团队整合到Demis Hassabis领导下的DeepMind,形成了高度统一的技术体系和紧密的迭代闭环,这被认为是2025年通过Gemini 3取得显著成效的关键[42][53] - 公司与三星等主要设备制造商建立了深度合作,Gemini已成为三星手机的核心AI和主要聊天机器人,并且也将成为苹果新版本Siri的核心引擎,这为技术提供了巨大的部署平台[43][52] 技术进展与产品竞争力 - Gemini系列模型表现强劲,最新版本Gemini 3让公司重新回到了AI排行榜的前列,被认为几乎可以与ChatGPT平起平坐,甚至在某些方面表现更好[3][30] - 公司认为实现AGI(通用人工智能)还需要5到10年时间,并且需要一两项重大的创新,而不仅仅是对现有理念(如Scaling Laws)的规模化提升[6][10] - 当前AI系统(如LLMs)的智能是碎片化的,缺乏持续学习、在线获取新知识和真正创造原创内容的能力,要实现AGI需要发展“世界模型”以理解物理规律和因果关系[7][8] - 公司正在开发名为Genie的交互式模型以及先进的视频模型,这些被视为早期“胚胎”世界模型,是迈向AGI所需的其他关键技术和能力[9][10] 行业竞争格局 - AI领域的竞争环境被描述为科技行业有史以来最激烈的,几乎所有最有能力的参与者和大型科技公司都已入场[28] - 中国在AI领域的进展迅速,其模型(如DeepSeek、阿里巴巴的模型)与美国和西方的前沿模型相比可能只落后几个月,但在实现真正的原创性突破方面尚未得到验证[35][36][37] - 行业部分领域可能存在估值泡沫,特别是私募市场中一些几乎没有产品或业务的项目筹集了数十亿美元资金,但从长远看不可持续[32] - 拥有强大资产负债表和稳定现金流的大型科技公司(如Google、Microsoft、Meta)在激烈的竞争中处于更有利的位置,能够调整方向并持续投入[40][53] 研发重点与未来展望 - 公司长期致力于将AI作为科学的终极工具,其AlphaFold项目解决了存在50年的蛋白质折叠难题,被超过300万研究人员使用,是AI应用于科学的最佳案例[4][48] - 公司正在多个科学领域推进类似AlphaFold的变革性项目,涵盖材料科学、物理学、数学以及天气预测等,有望开启科学发现的新黄金时代[48] - 预计2026年AI领域的重要进展包括:能够自主执行任务的智能体系统开始变得可靠并真正发挥作用;机器人领域将出现有趣进展;设备上的AI助手将在现实世界中发挥作用;世界模型将得到进一步推进[49] - AI被视为解决社会重大挑战(如气候变化、疾病、能源问题)的关键工具,同时其自身的发展也是一项需要谨慎管理的挑战[11][17] 基础设施与算力 - 公司除了使用GPU,还拥有自研的TPU芯片,通常用于内部训练性能最强的模型,而GPU则用于探索新的架构或应用(如AlphaFold)[11][48] - 算力和能源是AI发展的关键瓶颈,AI本身也能帮助提高基础设施效率、改进材料设计(如更高效的太阳能材料)甚至推动核聚变等突破性技术发展以解决能源问题[11] - 通过模型蒸馏等技术创新,AI系统的效率每年以约10倍的速度提升,推动每瓦特计算性能大幅增长[12]
深度|谷歌DeepMind CEO:中国在AI技术能否实现重大突破尚未验证,发明新东西比复制难一百倍
Z Potentials· 2026-02-02 13:00
文章核心观点 - Google DeepMind首席执行官Demis Hassabis在访谈中阐述了公司在人工智能领域的战略布局、技术进展与未来展望,核心观点包括:扩展定律仍有效但需结合重大创新以实现AGI、世界模型是迈向AGI的关键能力、AI是解决全球重大挑战的双刃剑且需负责任地开发、Google通过内部重组与整合已形成强大的AI产品化能力并在激烈竞争中占据有利位置[7][11][14][17][31][42] 技术进展与AGI路径 - **扩展定律与模型能力**:通过增加算力、数据量和模型规模,系统能力仍在获得非常可观的回报,但迈向AGI可能还需要一两项重大的创新,而不仅仅是对现有理念的规模化提升[7] - **当前AI系统的局限性**:现有系统智能表现是碎片化的,缺乏一致性,且无法持续学习、在线获取新知识或真正创造原创内容,这些能力对于实现真正的AGI仍然缺失[8] - **世界模型的关键作用**:为实现AGI,需要系统理解世界的物理规律和因果关系,能够进行长期规划并验证假说,即构建“世界模型”,这是顶尖科学家所做的事情而当前AI系统尚无法做到[9][10] - **技术融合趋势**:基础模型(如Gemini)仍是核心,但实现AGI需要世界模型等其他类型的技术和能力,这些技术最终会趋向融合,例如将视频生成模型视为早期“胚胎”世界模型[11] - **实现AGI的时间表**:DeepMind创立时设想为约20年的长期使命,目前认为距离实现展示所有认知能力的AGI大约还有5到10年时间[11] 行业竞争与市场格局 - **竞争环境异常激烈**:被描述为科技行业有史以来最激烈的竞争环境,几乎所有最有能力的参与者(科技巨头和优秀初创企业)都在参与,因为AI被视为迄今为止最重要的技术[29] - **Google的竞争策略与调整**:过去两到三年,公司回归到类似初创公司的灵活、快速模式,快速推出产品并取得实质性进展,这在Gemini系列中得到了体现,并使其重新回到了排行榜的前列[31] - **对中国AI进展的评估**:中国在开发强大AI模型方面比一两年前预想的更接近美国和西方的前沿模型,可能只落后几个月,但关键问题在于其能否在前沿之外实现真正的、突破性的创新[35][36] - **AI行业是否存在泡沫**:行业的某些部分可能存在泡沫,但AI将成为人类历史上最具变革性的技术是核心支撑,过度热情不可避免,随后可能迎来清算,真正有价值的事物将生存并繁荣,特别指出私募市场中种子轮融资达数十亿美元却几乎无产品的情况不可持续[33] - **Google的竞争优势**:拥有强大的资产负债表、自由现金流和数十款拥有数十亿用户的产品,AI可以自然融入所有这些产品,使其无论未来局势如何发展都能处于有利位置并从中受益[34][40][53] 公司战略与业务整合 - **DeepMind与Google的整合**:过去三年,Google将所有的AI研究整合为Google DeepMind实体,汇集了Google Research、Google Brain和DeepMind,该团队被视为整个公司的“发动机室”,负责所有AI技术开发并扩散到各个产品中[41] - **高效的内部协作与部署**:CEO与Google/Alphabet的CEO几乎每天沟通战略,内部构建的基础设施使新模型(如Gemini)能够非常快速地部署,几乎可以当天或第二天就上线到搜索等核心产品,形成了紧密的迭代闭环和高度统一的技术体系[42] - **通过合作伙伴扩大生态**:技术与三星等大型设备厂商合作,将其作为核心AI集成到智能手机等终端,并对边缘计算和在更多设备(如智能眼镜)上部署AI助手的概念非常感兴趣[43][52] - **收购DeepMind的历史价值**:Google在2014年以约4亿英镑(当时约5.4亿美元)收购DeepMind,按照现在的估算,这笔投资的价值可能已达到数百亿甚至上千亿美元,收购被证明与Google“组织全球信息”的使命高度契合[5][44][45] AI的应用与影响 - **AI作为科学发现的终极工具**:AI最终将成为科学的终极工具,已通过AlphaFold(解决了存在50年的蛋白质折叠难题,超过300万研究人员使用)等项目证明,未来有望在材料科学、物理学、数学等多个领域开启科学发现的新黄金时代[9][47][48] - **解决能源等全球挑战**:AI本身是能源消耗者,但也能帮助提高基础设施效率、改进材料设计(如更高效的太阳能材料)、推动核聚变等突破性技术,甚至可能帮助发现室温超导材料,被认为是AI最有前景的应用场景之一[12] - **积极影响与潜在风险**:AI可能成为人类历史上最具深远影响和正向价值的技术之一,其应用包括加速药物发现以攻克疾病,但同时也可能带来类似工业革命但规模更大、速度更快的经济冲击,以及被用于恶意目的或自主系统偏离预期等风险[13][14] - **2026年及未来的关键进展**:预计能够自主执行任务的智能体系统将开始变得足够可靠,机器人领域将出现有趣进展,设备上的AI助手将在现实世界中真正发挥作用,世界模型的进一步推进以实现更高效的规划也令人兴奋[49] 产品与市场部署 - **Gemini系列的发展**:Gemini模型的表现让公司重新回到了竞争前列,其背后技术很大程度上来自DeepMind,最新版本Gemini 3的反响非常好[5][31] - **广泛的产品集成与用户触达**:Google开发的AI能够在其整个产品矩阵(如Chrome、Gmail)中全面铺开,借助Android操作系统约70%的全球市场份额,可以迅速触达海量用户,这构成了巨大的市场推广优势[51] - **关键合作伙伴关系**:三星已全面采用Gemini作为其核心AI,苹果也将在新版本Siri中使用Gemini作为核心引擎,这为Gemini提供了巨大的平台和市场份额[52]
AlphaGo之父David Silver离职创业,目标超级智能
机器之心· 2026-01-31 10:34
核心事件 - 谷歌DeepMind知名研究员David Silver已离职并创办AI初创公司Ineffable Intelligence [1] - 公司成立于2025年11月,Silver于2026年1月16日被任命为董事,目前正在伦敦积极招聘研究人员并寻求风险投资 [3][4] - Silver在离职前数月处于休假状态,谷歌DeepMind已证实其离职并高度评价其贡献 [4] 创始人背景与成就 - David Silver是DeepMind创始成员之一,与联合创始人Demis Hassabis大学时期相识,是公司多项突破性成就的关键人物 [9] - 其关键贡献包括:2016年击败世界冠军的围棋AI AlphaGo [9]、2019年达到《星际争霸II》大师级水平的AlphaStar(排名前0.2%)[12]、能超人水平玩多种棋类的AlphaZero与MuZero [14]、2024年达到国际数学奥赛银牌水准的AlphaProof [14] - 他是2023年介绍谷歌首个Gemini系列AI模型研究论文的作者之一 [14] - 目前仍保留伦敦大学学院的教授职位 [9] - 拥有极高的学术影响力:论文总被引次数超过28.5万次,h-index为104,i10-index为180 [16][17] - 是2024年图灵奖得主Richard Sutton的门生,以强化学习研究闻名,被认为是该领域最坚定的支持者之一 [17][18] 创业动机与公司愿景 - Silver渴望重拾“解决AI领域最棘手难题的敬畏与奇妙之感”,并将实现“超级智能”视为最大未解之谜 [14] - 他认为大型语言模型受限于人类知识,呼吁AI进入以强化学习为基础的“经验时代”,以实现超越人类认知的AI [18][20] - Ineffable Intelligence旨在构建一种能够不断学习、自主发现所有知识基础的超级智能 [23] 行业趋势与竞争格局 - 近年来多位顶尖AI研究人员离开大型实验室创办追求超级智能的初创公司,形成趋势 [15] - 例如:OpenAI前首席科学家Ilya Sutskever于2024年创立Safe Superintelligence (SSI),已融资30亿美元,估值达300亿美元 [15] - Silver在DeepMind的同事也离职创办了同样研发超级智能的Reflection AI [15] - Meta重组AI部门成立“超级智能实验室”,而原首席AI科学家Yann LeCun选择离职创业 [15] 技术理念与差异 - Silver认为当前大语言模型的“预训练”和基于人类反馈的“后训练”阶段,其能力上限被人类知识锁死 [18][20] - 强化学习通过试错和反馈进行决策,能使AI自主探索并发现人类未知的新事物,是通往超级智能的途径 [17][18] - 他以AlphaGo和AlphaZero的“非人类”但绝妙的决策为例,说明基于人类偏好的评估可能限制AI潜力 [20][23] - 其理念是AI需要超越并可能摒弃人类知识,从基本原理出发学习以实现目标 [23]
DeepMind强化学习掌门人David Silver离职创业!Alpha系列AI缔造者,哈萨比斯左膀右臂
量子位· 2026-01-31 09:34
核心人物动态 - 强化学习领域权威专家David Silver已从DeepMind离职,结束了在该公司长达15年的职业生涯 [1][2] - 其离职后创立了一家名为Ineffable Intelligence的新AI公司,该公司已于2025年11月注册成立,Silver于2026年1月16日正式出任公司董事 [2][3] - 新公司总部位于伦敦,目前正处于积极招募研究人才和寻求风险投资的阶段 [7] 人物背景与成就 - David Silver是DeepMind的元老级研究员,于2010年公司创立之初加入,与联合创始人Demis Hassabis是大学好友并曾共同创业 [12] - 作为强化学习团队负责人,他主导或深度参与了DeepMind几乎所有里程碑项目,是“Alpha系列”AI的核心缔造者 [12] - 其代表性成就包括:2016年领导开发击败围棋冠军李世石的AlphaGo [14];开发出在不依赖人类棋谱情况下精通围棋、国际象棋和日本将棋的AlphaZero [14];开发出无需知晓规则即可掌握多种游戏的MuZero [15];开发出击败《星际争霸II》顶尖职业选手的AlphaStar [16];近期参与了可解答国际数学奥林匹克竞赛题目的AlphaProof以及谷歌首个Gemini模型的研究 [17] - 其学术影响力巨大,是DeepMind发表论文最多的研究员之一,谷歌学术统计其论文总被引次数超过28万次,h-index高达104 [19] 创业动机与理念 - 创业动机是希望回归“解决AI领域最难题所带来的敬畏与奇迹”,并将实现超级智能视为当前最大的未解挑战 [20] - 其目标是构建一个能够自我发现所有知识基础、并能永无止境学习的超级智能 [21] - 他认为当前主流的大语言模型能力受限于人类已有知识,倡导AI进入“经验时代”,即通过强化学习从经验中自我学习,从而发现人类未知的新事物 [22][24] - 他强调实现真正的超级智能,AI必须摆脱对人类知识和直觉的依赖,从第一性原理出发进行学习,并以AlphaGo对战李世石时超出人类专家理解的第37手棋为例证 [24][25]