很值得留意: Robust Autonomy Emerges from Self-Play

2025年2月5日苹果发布Robust Autonomy Emerges from Self-Play，所有作者名看起来都不是中国人。论文链接： https://arxiv.org/pdf/2502.03349 小米王乃岩对这篇论文的评价是现阶段强化学习如果想攻克自动驾驶，最相关，也是最值得推荐的一个工作。王乃岩个人觉得这是一个里程碑级别的工作，标志着强化学习在自动驾驶中向前迈了一大步。这篇论文如果能被后世公认为里程碑级别的工作，意味着将来量产的更强的自动驾驶方案将通过Self- Play RL( 自我博弈强化学习)的方式获得。这是第一篇在自动驾驶领域证明了完全基于 Self-Play RL( 自我博弈强化学习)的有效性。其在所有闭环benchmark（nuPlan、CARLA、Waymax）上都刷到了benchmark（基准测试）性能上限。如果 Self-Play RL( 自我博弈强化学习)将来不成为自动驾驶主流或热点研究方案，那这篇论文也就称不上里程碑工作。一旦 Self-Play RL( 自我博弈强化学习)成为了自动驾驶主流方案，意味着人类驾驶数据重要性将大大降低，极端情况下是压根 ...