公司技术发布 - 小马智行于4月10日正式发布了物理AI领域的最新技术成果——PonyWorld世界模型2.0 [1][6] - 与1.0相比,世界模型2.0最本质的变化是具备了自我诊断与定向进化的能力,能自主诊断短板并主动“指导”人类团队的研发和数据采集工作 [1][6] - 这一变化标志着公司的自动驾驶技术进入了全新的研发训练范式 [1][6] 技术应用与目标 - 世界模型2.0已应用于公司的L4级无人驾驶车队和研发体系,旨在提升车辆的安全性、舒适性和通行效率,从而带动更快的扩张速度和商业变现能力 [1][7] - 当无人驾驶车队规模从百辆跃升至千辆乃至万辆时,该技术是确保安全性等指标稳步提升的最优解 [1][7] - 公司认为自动驾驶模型的训练目标不应是“像人开得一样”,而是“比人开得好”,这代表从模仿学习到强化学习的范式变化 [2][7] 核心技术能力突破 - 自我诊断能力:世界模型2.0结合车端模型的意图语义层,实现了对每次驾驶决策的自动化回溯与归因分析,能自动区分问题根源并反馈至训练流程 [3][9] - 定向进化能力:基于自我诊断结果,系统能自动识别精度不足的具体场景,并主动生成定向数据采集任务,指导团队高效协作 [4][10] - 训练效率跃升:系统可根据车端模型的薄弱环节,在世界模型中自动生成针对性训练场景,大幅减少无效训练数据的存储与计算开销,提升迭代效率和效果 [5][11] 研发体系与数据积累 - 公司从2020年起,打造了一套贯穿云端与车端的完整强化学习体系,即“世界模型”,帮助AI在“虚拟驾校”中训练,提升博弈交互能力 [2][7] - 世界模型精度的提升依赖于一个自我强化的“精度飞轮”:大规模L4运营→产生高价值真实数据→世界模型精度提升→车端模型增强→支撑更大规模部署 [5][11] - 当AI驾驶能力远超人类后,普通人类驾驶数据对模型精度提升的价值趋近于零,只有L4全无人车队在真实环境中产生的数据(包含独特的交互模式)才能持续推动进化 [5][11] - 公司已积累千万公里级的多城市复杂场景纯无人驾驶数据,覆盖城区、高速、园区、停车场等多元场景,形成了难以复制的结构性优势 [5][11] 行业研发范式变革 - 世界模型2.0的发布代表了自动驾驶研发范式从“人类驱动”向“AI驱动”的深层转变 [6][12] - 早期研发高度依赖人类工程师的经验,效率天花板受限于团队规模和认知带宽 [6][12] - 当AI能力远超人类后,AI系统开始接管自身进化中越来越多的环节,甚至主导整个公司的研发环节(数据收集、模型训练、仿真评估等) [6][12] - 人类工程师的角色从“驾校教练”逐渐转变为“定向数据采集员”,成为AI自我进化的物理执行者,这使得研发节奏由AI系统根据自身进化需求自动生成,显著提高了迭代效率 [6][12] 未来潜力 - PonyWorld世界模型不局限于优化自动驾驶场景,也具有探索其他物理AI场景和应用的可能 [1][7] - 该技术为后续物理AI的更多应用场景提供了进化能力的基础 [6][12]
小马智行发布PonyWorld世界模型2.0:可自主进化的物理AI引擎