文章核心观点 - 商汤绝影发布了生成式智能驾驶技术方案R-UniAD,通过引入强化学习与世界模型,构建VLAR技术架构,旨在解决端到端智能驾驶在数据、安全与性能方面的瓶颈,提升驾驶安全确定性并超越人类驾驶极限 [2][6][9][16] 技术架构与方案 - R-UniAD是“多阶段强化学习”端到端技术方案,包含模仿学习冷启动、与世界模型协同的强化学习训练、以及高效蒸馏至车端部署三个阶段 [9] - 公司构建了集“视觉-语言-行动-强化学习”于一体的VLAR技术架构,作为R-UniAD第二阶段的核心 [6][9] - 该架构依托云端超100万案例和1024种场景类型构建虚拟测试场景,使实采Corner Case数据需求降低2个量级 [9] - 通过强化学习训练的模型,相较于人类驾驶员的碰撞率降低1个量级 [9] 世界模型“绝影开悟2.0” - “绝影开悟”世界模型已升级至2.0版本,进化为近实时在线交互的4D世界模型,具备“4D空间自由交互”能力 [17] - 该模型具备三大核心能力:面向量产的数据生成、复杂场景自由复现、以及近实时交互 [19][20] - 在数据生成方面,可从100多个维度组合生成万千场景(如Cut-in场景),并能通过提示词一键生成极端风险场景(如车祸) [19] - 在场景复现方面,可任意修改调整场景要素,如替换车辆、改变道路布局与车速等 [19] - 其近实时交互能力比行业SOTA提升5倍,感知结果接近真实精标数据98% [20] 技术优势与效果 - 针对“施工占道刹停”等复杂场景,R-UniAD基于世界模型进行4D仿真复现,流程耗时从传统方案数天缩短至几个小时,场景一致性达到95%,相比单一3DGS技术提高1.5倍 [11] - 在仿真环境中,通过设置Reward计算维度(如加速度、是否碰撞等)进行数千次强化学习训练,使模型能找到最优驾驶策略,实现预判与丝滑绕行 [11][12] - 经过泛化训练后,模型对类似前方障碍物场景的交互能力显著提升 [13] - 该技术方案让端到端模型能够比人类“看更多”、“学更快”、“开更好” [16] 商业化与量产进展 - 商汤绝影辅助驾驶方案目前已合作4家车企,上车7款车型 [1][21] - 2025年3月底,公司与广汽联合打造的行业首批基于地平线征程6M的辅助驾驶方案已量产上市 [21] - 2025年,公司将继续推进基于地平线征程6的方案在奇瑞等车企量产落地,基于英伟达DRIVE AGX Thor平台的端到端量产方案计划于第四季度在东风汽车交付 [1][21] - 公司基于地平线征程6的量产方案获得了中汽研《CATARC标志认证实施规则–“征程之星”领航辅助驾驶认证》 [23] - 截至2024年12月,商汤绝影已与超过30家国内外车企合作,覆盖超130款车型,累计交付总量超360万辆 [25] 行业背景与挑战 - 当前许多辅助驾驶方案在新场景下处理能力不足,事故时有发生 [1] - 端到端模型依赖海量高质量数据训练,但极端场景有效信息提取率不足1%,高价值数据稀缺 [1][5] - 端到端范式本质是模仿学习,在新场景下决策不确定性高,安全边界模糊,且难以超越人类驾驶能力上限 [1][5] - 行业正从规则式、感知决策一体化的端到端模型,向生成式智驾演进 [3][5]
商汤绝影打造智能驾驶新路标——生成式智驾R-UniAD,让安全更有确定性,超越人类驾驶极限
观察者网·2025-04-24 09:18