Waymo World Model - 财报，业绩电话会，研报，新闻

Waymo World Model

搜索文档

Waymo联手DeepMind打造世界模型：基于Genie 3，让自动驾驶「脑补」罕见场景

机器之心· 2026-02-07 15:00

文章核心观点 - Waymo推出了基于DeepMind Genie 3构建的全新世界模型Waymo World Model，旨在通过生成高度逼真、可交互的3D仿真环境，为自动驾驶系统提供大规模、超真实的训练与测试能力，以应对现实世界中罕见和极端的“长尾”场景[1][4] 技术基础与架构 - 模型建立在Google DeepMind的通用世界模型Genie 3之上，并针对自动驾驶需求进行了专业化适配[4] - 模型能够生成高度逼真且可交互的3D环境，并支持生成高保真、多传感器数据，包括摄像头图像和激光雷达点云[4] - 通过专门的后训练流程，将Genie 3从庞大2D视频数据中学习到的世界知识，迁移到了Waymo硬件套件独有的3D激光雷达输出中，实现了跨传感器模态的场景生成[8] 核心能力与优势 - **大规模仿真经验**：Waymo Driver在真正驶上公共道路前，已在虚拟世界中行驶了数十亿英里，远超其近2亿英里的真实道路行驶里程[4] - **处理罕见与极端场景**：模型可以模拟现实中几乎无法大规模复现的罕见事件，例如遭遇龙卷风、大象、长角牛等[4][9][10] - **强大的模拟可控性**：通过三种主要机制实现高度可控的仿真[11] - **驾驶行为控制**：创造响应迅速的仿真器，遵循特定驾驶输入，用于模拟“如果…会怎样”的反事实事件[11] - **场景布局控制**：允许自定义道路布局、交通信号灯状态以及其他道路使用者的行为，以创建定制场景[13] - **语言控制**：最灵活的工具，可用于调节时间、天气状况，甚至生成完全合成的长尾场景[16][17][19] - **真实感与准确性**：可将普通相机拍摄的视频（如行车记录仪视频）转换为多模态仿真，呈现Waymo Driver在同一场景下的“所见”，该过程在真实感和事实准确性上达到最高水平[22] - **可扩展推理**：通过高效变体模型，可以在显著降低计算量的同时模拟更长的场景（如4倍速播放），并保持高真实感与高保真度，支持大规模仿真[24][25] 应用与行业影响 - 该模型是支撑Waymo进行大规模虚拟测试的核心基础设施，使自动驾驶系统能够在现实世界之外，提前掌握应对真实世界复杂挑战的能力[4] - 通过模拟罕见、极端边缘场景（如逆向行驶车辆、极端天气、动物穿行、繁忙街区穿行等），为自动驾驶系统设立了更严格的安全基准，确保其在现实道路上遇到类似挑战前已具备应对能力[5][6][9][27][28]

Google World Model AI Accelerates Waymo Robotaxi Expansion

PYMNTS.com· 2026-02-07 07:32

Waymo发布基于Genie 3的Waymo世界模型 - 公司最新推出的Waymo世界模型基于谷歌DeepMind的通用世界模型Genie 3构建，并针对自动驾驶模拟进行了适配 [2] - 该模型利用Genie 3的世界知识，能够模拟更广泛的事件，包括极端天气、自然灾害以及罕见且安全关键的事件 [3] - 该模型使工程师能够使用简单的语言提示、驾驶输入和场景布局来修改模拟 [3] Waymo世界模型的技术优势与目标 - 该模型结合了广泛的世界知识、精细的可控性和多模态真实感，增强了公司安全地将服务扩展到更多地点和新驾驶环境的能力 [4] - 世界模型的系统旨在理解世界如何运作，而不仅仅是外观，其整合了感知、模拟、空间推理和预测，使机器能够建立因果关系的内部模型 [4] 基础模型Genie 3的技术特点 - Genie 3是一种能够生成受物理规律支配的3D环境的世界模型，人工智能体通过探索虚拟世界而非静态数据集进行学习 [5] - 谷歌DeepMind于1月29日推出了一个由Genie 3驱动的实验性研究原型“Project Genie”，它使用最新的世界模型AI来生成和探索交互式虚拟环境 [6] 行业影响与公司动态 - 华尔街对Genie 3的发布做出反应，由于担心该AI系统能够从零开始生成视频游戏，导致整个视频游戏行业市值蒸发数十亿美元 [7] - 公司于2月2日宣布在一轮融资中筹集了160亿美元，融资后估值达到1260亿美元，其母公司Alphabet作为主要投资者继续提供支持 [7]

谷歌(US:GOOG)

Artificial Intelligence

Artificial Intelligence