Waymo的整体人工智能战略与方案 - 公司正通过将“可验证安全的人工智能”置于核心优先级来攻克自动驾驶挑战,安全是从底层设计模型与生态系统的核心准则[2] - 公司已打造出一套极其先进的人工智能系统,并实现大规模安全落地于物理世界,完全自动驾驶里程已远超1亿英里[2] - 在运营区域,与人类驾驶员相比,严重事故发生率降低了十倍以上[2] - 公司的人工智能战略旨在让安全的自动驾驶服务以史无前例的速度惠及更多用户[2] Waymo基础模型架构 - Waymo基础模型是一款多功能、顶尖的“世界模型”,为整个人工智能生态系统提供动力[7] - 其创新架构相比纯粹的端到端方案或模块化方案具备显著优势[7] - 模型充分利用习得嵌入的强大表达能力,作为模型各组件间的丰富交互接口,并支持完整的端到端信号反向传播[7] - 额外的紧凑、具象化的结构化表示可实现特定功能[7] - 模型采用“快速反应与深度思考”架构,包含两个不同的模型组件[9] - 两个编码器的输出接入世界解码器,该解码器利用输入数据预测其他道路使用者行为、生成高清地图、规划车辆轨迹,并为轨迹验证提供信号[10] 人工智能生态系统:驾驶员、仿真器与评估器 - 基于整体方案,Waymo基础模型为“驾驶员”、仿真器和评估器提供动力[11] - 公司首先将基础模型适配三大任务,训练出大型、高质量的教师模型[11] - 通过安全的模型蒸馏技术,将大型教师模型转化为更小、更高效的学生模型,以在车辆上实时运行或在云端高效处理任务[11] - 模型蒸馏是关键环节,能在保留大型模型卓越性能的同时,得到更紧凑、高效的版本,并实现更优的缩放定律[11] 驾驶员系统 - 教师驾驶模型经过训练,能够生成安全、舒适且合规的动作序列[13] - 通过蒸馏技术,将其丰富的世界理解能力和推理能力迁移至更高效的学生模型,用于车载实时部署[13] - 车载架构设计与Waymo基础模型的结构保持一致[13] - 自动驾驶系统配备了独立且严格的车载验证层,用于验证其生成式机器学习模型所规划的行驶轨迹[13] 仿真器系统 - 仿真器是自动驾驶系统闭环训练和测试的核心工具,可覆盖各类多样化、高难度场景[15] - 仿真器教师模型能够创建高保真、多模态的动态虚拟世界,用于评估“驾驶员”[15] - 学生模型是大型模型的计算高效版本,专为满足大规模仿真任务而设计[16] - 基础模型的架构支持将紧凑的具象化世界状态表示与传感器仿真无缝结合,打造出大规模、超逼真、物理层面准确且计算高效的虚拟环境[16] - 通过对全局场景元素使用文本提示,同时对动态元素进行语义条件约束,能够将真实世界场景转化为高度逼真的仿真场景[17] 评估器系统 - 顶尖评估系统旨在对Waymo自动驾驶系统进行压力测试,主动识别细微的边缘场景,并支持快速、有针对性的改进[17] - 评估器教师模型能够分析驾驶行为并生成高质量的反馈信号,用于训练学生模型和自动构建评估数据集[17] - 评估器学生模型会分析驾驶日志,识别有趣或有问题的场景,并对驾驶质量提供细致的反馈[17] 持续学习与优化的飞轮效应 - Waymo自动驾驶系统的演进得益于多种机制的协同作用,形成了持续学习与优化的飞轮效应[18] - 内部学习循环由仿真器和评估器提供动力,利用强化学习在安全可控的仿真环境中对“驾驶员”进行大规模训练[18] - 外部学习循环基于真实道路驾驶数据,形成了更强大的学习飞轮[18] - 外部循环始于评估器从海量的完全自动驾驶经验中自动标记出任何次优驾驶行为,随后生成改进后的替代行为作为训练数据,在仿真器中严格测试并由评估器验证,最终经安全框架确认后部署到真实道路[18] - 这一飞轮效应的实现得益于公司多年来积累的海量完全自动驾驶数据,且数据仍在以指数级速度持续增长[20] - 目前,公司的完全自动驾驶里程已远超人工驾驶数据量[20] - 庞大的真实世界完全自动驾驶经验是无可替代的,将其直接融入独特的飞轮体系,使系统能够从自身海量经验中学习,实现持续优化[20] 行业技术趋势与定位 - 基本上可以断定Waymo在跟随国内的快慢双系统端到端方案,和理想的E2E+VLM以及小鹏VLA2.0有相似之处[2] - 公司通过采用整体人工智能方案并构建学习飞轮,不仅在推动自身自动驾驶系统的进步,更在树立大规模安全自动驾驶的行业标准[21]
Waymo最近的基座模型分享:快慢双系统端到端 & 世界模型仿真
自动驾驶之心·2025-12-27 17:36