自动驾驶仿真数据规模效应
搜索文档
仿真数据也能Scaling!虚实结合训练,端到端性能全面提升|中科院x港大x小米汽车
量子位· 2025-12-11 09:33
来自香港大学OpenDriveLab、中科院自动化所、小米汽车的联合团队提出了一种解决方案—— SimScale 。 自动驾驶数据荒怎么破? OpenDriveLab 投稿 量子位 | 公众号 QbitAI 该方案 通过真实世界仿真生成关键场景,以及真实仿真协同训练策略,首次揭示了自动驾驶仿真数据的规模效应 。 现实世界难以提供足够的关键与长尾场景,采集到的大多是价值有限的常态片段,导致 数据越多、提升越难 。 因此,自动驾驶的瓶颈不在规模,而在缺乏能系统生成关键场景并支撑大规模训练的新路径。 无需更多真实数据, 只靠扩大仿真数量,一样能持续突破任何端到端驾驶模型的性能上限 。 为什么要有SimScale? 因为让大模型屡创新高的Data Scaling,在自动驾驶场景中失灵了—— 为此,SimScale应运而生。 什么是SimScale? SimScale是一个能"无限扩张世界"的仿真生成框架,通过高保真神经渲染,自动制造多样化反应式交通场景与伪专家示范。 它也是一套让仿真与真实"相互增益"的训练策略,使各种端到端模型都能越训越强,鲁棒性与泛化性全面提升。 它还是一份首次系统揭示自动驾驶仿真规模效益的"实践 ...