“现代 AI 九成突破都来自我们!”面对核心团队被挖,谷歌 DeepMind 掌门人的回应挺硬

公司人才与研发实力 - 尽管近期有核心人才被竞争对手挖走,但公司认为其在人才市场上赢得了该赢的部分,并依然拥有行业里最宽广的研究板凳席[1] - 公司拥有迄今为止所有领先实验室中最大、最广泛的研究梯队,并持续产出绝对前沿的成果[10] - 支撑现代AI产业的大量关键突破(可能超过90%)来自Google Brain或DeepMind,包括Transformer、AlphaGo及强化学习的开创性工作[8] 通用人工智能(AGI)的技术路径 - 仅依靠纯文本写代码和自省模型无法通往AGI,智能必须理解物理世界[3] - 实现完整的AGI系统需要其能够理解周围的物理世界,这对于机器人、智能眼镜等硬件场景的落地至关重要[8] - 公司采取在多条技术路线上同时下注的策略,包括扩展性研究、多模态基础模型Gemini、代码能力,以及Omni、Veo等多模态生成媒体模型[8] 生成式AI的进展与应用 - 视频与图像生成工具在过去一年取得了显著进步,具备了“实时编辑”生成结果的细粒度控制能力,整体质量也在持续提升[12][13] - 这些工具正在降低创意行业的门槛,让更多人能够尝试自己的想法,同时也让专业创作者能够以10倍的效率尝试更多想法并更快迭代[16][17] - 在游戏行业,AI工具目前主要用于制作素材等显而易见的事情,但其有潜力改变游戏本质并催生全新的游戏类型[17][18] 多模态与物理世界理解 - 理解物理世界是智能的关键,因此需要开发能够看懂视频、理解现实世界的多模态模型[6] - 分析科学数据(如细胞、蛋白质图像)与分析一般视觉信息(如YouTube视频)所需的能力类型是相同的,这些能力本质上是通用的[22] - 公司开发Omni和Veo等多模态生成媒体模型,旨在让系统理解周围的世界和上下文[8] AI安全、水印与监管 - 随着生成式AI(尤其是视频)能力逼近真人,深度伪造和错误信息风险加剧,必须处理数字水印问题[14] - 公司开发了名为SynthID的隐形数字水印系统,并将其内置于所有生成内容的模型中,同时开源给整个行业使用[14][15] - 公司认为,为生成式媒体内容嵌入来源检测机制(水印)在未来应当成为一种强制性的监管要求,类似于汽车安全带[6][15] 模拟、创造力与科学研究 - 人类的想象力本质上是一个“物理模拟器”,AI同样需要通过类似“海马体”的机制,在虚拟世界中运行模拟来寻找最优解[6][25] - 真正的创造力不是拼接数据,而是在有限信息中推导出新真理,如同爱因斯坦通过思想实验提出相对论[6][29] - “学会了的模拟”非常关键,AI系统可以从数据中学会模拟复杂系统(如天气、经济),从而帮助进行信息更充分的决策[35][36][37] AI发展的历史与哲学 - 在2010年,于工业界甚至学术界研究AI(尤其是神经网络)被视为“职业自杀”,但一小群人通过押注强化学习和神经网络证明了其潜力[3][10][11] - 早期让AI玩围棋、雅达利游戏并非目的本身,而是设定可量化、可实现的中间目标,作为一步步通向解决现实问题(如AlphaFold)的研究阶梯[23] - 构建通用智能系统是公司的核心目标,这意味着系统能够从任何输入中学习,并以任何方式输出有价值的洞见,其所需的能力类型是通用的[21][22]

“现代 AI 九成突破都来自我们!”面对核心团队被挖,谷歌 DeepMind 掌门人的回应挺硬 - Reportify