“现代 AI 九成突破都来自我们！”面对核心团队被挖，谷歌 DeepMind 掌门人的回应挺硬

公司人才与研发实力 - 尽管近期有核心人才被竞争对手挖走，但公司认为其在人才市场上赢得了该赢的部分，并依然拥有行业里最宽广的研究板凳席[1] - 公司拥有迄今为止所有领先实验室中最大、最广泛的研究梯队，并持续产出绝对前沿的成果[10] - 支撑现代AI产业的大量关键突破（可能超过90%）来自Google Brain或DeepMind，包括Transformer、AlphaGo及强化学习的开创性工作[8] 通用人工智能（AGI）的技术路径 - 仅依靠纯文本写代码和自省模型无法通往AGI，智能必须理解物理世界[3] - 实现完整的AGI系统需要其能够理解周围的物理世界，这对于机器人、智能眼镜等硬件场景的落地至关重要[8] - 公司采取在多条技术路线上同时下注的策略，包括扩展性研究、多模态基础模型Gemini、代码能力，以及Omni、Veo等多模态生成媒体模型[8] 生成式AI的进展与应用 - 视频与图像生成工具在过去一年取得了显著进步，具备了“实时编辑”生成结果的细粒度控制能力，整体质量也在持续提升[12][13] - 这些工具正在降低创意行业的门槛，让更多人能够尝试自己的想法，同时也让专业创作者能够以10倍的效率尝试更多想法并更快迭代[16][17] - 在游戏行业，AI工具目前主要用于制作素材等显而易见的事情，但其有潜力改变游戏本质并催生全新的游戏类型[17][18] 多模态与物理世界理解 - 理解物理世界是智能的关键，因此需要开发能够看懂视频、理解现实世界的多模态模型[6] - 分析科学数据（如细胞、蛋白质图像）与分析一般视觉信息（如YouTube视频）所需的能力类型是相同的，这些能力本质上是通用的[22] - 公司开发Omni和Veo等多模态生成媒体模型，旨在让系统理解周围的世界和上下文[8] AI安全、水印与监管 - 随着生成式AI（尤其是视频）能力逼近真人，深度伪造和错误信息风险加剧，必须处理数字水印问题[14] - 公司开发了名为SynthID的隐形数字水印系统，并将其内置于所有生成内容的模型中，同时开源给整个行业使用[14][15] - 公司认为，为生成式媒体内容嵌入来源检测机制（水印）在未来应当成为一种强制性的监管要求，类似于汽车安全带[6][15] 模拟、创造力与科学研究 - 人类的想象力本质上是一个“物理模拟器”，AI同样需要通过类似“海马体”的机制，在虚拟世界中运行模拟来寻找最优解[6][25] - 真正的创造力不是拼接数据，而是在有限信息中推导出新真理，如同爱因斯坦通过思想实验提出相对论[6][29] - “学会了的模拟”非常关键，AI系统可以从数据中学会模拟复杂系统（如天气、经济），从而帮助进行信息更充分的决策[35][36][37] AI发展的历史与哲学 - 在2010年，于工业界甚至学术界研究AI（尤其是神经网络）被视为“职业自杀”，但一小群人通过押注强化学习和神经网络证明了其潜力[3][10][11] - 早期让AI玩围棋、雅达利游戏并非目的本身，而是设定可量化、可实现的中间目标，作为一步步通向解决现实问题（如AlphaFold）的研究阶梯[23] - 构建通用智能系统是公司的核心目标，这意味着系统能够从任何输入中学习，并以任何方式输出有价值的洞见，其所需的能力类型是通用的[21][22]