模型性能突破 - 千寻智能团队研发的Spirit v1.5模型在RoboChallenge评测榜上超越此前霸榜的Pi0.5,以66.09的总分和50.33%的成功率夺得总榜第一,而Pi0.5的分数和成功率分别为61.84和42.67% [2][4] - 这是中国具身智能模型首次在性能上超越海外最先进的开源模型,标志着中国在该领域进入全球领先阶段 [2] 传统数据方法的局限性 - 依赖高度“干净”的演示数据是模仿学习的弊病,其对应高昂成本,且存在多样性低和可扩展性受限的问题 [5] - 数据多样性低:采集过程遵循固定指令,导致数据缺乏多样性,例如“擦桌子”的数据集无法让模型学习处理打滑、杂乱表面或光线变化等现实复杂性 [5] - 可扩展性受限:每个新任务都需要精细的设计和质量控制,消耗大量工程资源,限制了数据采集的体量和模型可获得的机器人经验 [5] Spirit v1.5的核心技术特点 - 模型训练不依赖高度精选的“干净”演示数据,避免了因数据过于理想化而限制机器人在开放世界中的泛化能力 [6][7] - 在预训练阶段引入了开放式、多样化的数据采集范式,数据采集以“完成有意义目标”为导向,允许操作中自然串联多个子任务,使模型能接触到遮挡、失败恢复等真实世界复杂性 [8] - 这种基于多样化数据的预训练范式,代表了机器人学习领域摆脱对高度精选数据集依赖的根本性转变 [14] 多样化数据的训练优势 - 消融实验表明,在相同数据规模下,基于多样化数据预训练的模型在新任务上的迁移效率明显高于基于传统演示数据训练的模型,达到相同性能所需的计算资源显著减少 [9] - 多样化数据预训练的模型比干净数据训练的模型具有更快的收敛速度和更好的验证误差 [12] - 模型迁移效率随多样化数据量的增加呈正相关,数据规模扩大能持续降低模型在新任务上的验证误差,表明任务多样性比单任务演示数量更为关键 [13][16] - 使用高多样性、弱控制的数据进行预训练不仅可行,而且显著优于学术界常见的利用“干净”数据的做法 [13]
一直霸榜的pi0.5,被中国的模型干下来了!!!
具身智能之心·2026-01-12 08:03