Workflow
数据集多样性
icon
搜索文档
探究具身机器人有限泛化能力的本质原因!增强策略依然有效
具身智能之心· 2025-08-12 08:03
点击下方 卡片 ,关注" 具身智能 之心 "公众号 作者丨 Youguang Xing等 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要的。 研究背景与核心问题 近年来,随着大规模机器人数据集(如Open X-Embodiment/OXE)和高容量模型的发展,通用机器人策略在多种任务上展现出强大能力。然而,这些策略在面对训 练数据分布之外的场景时,泛化能力仍然有限。有趣的是,这种限制不能简单归因于数据量不足——OXE包含超过一百万段轨迹,远超典型视觉语言模型训练数 据集的规模。 研究者发现, 捷径学习 (shortcut learning)——模型依赖任务无关特征而非真正因果关系——是限制泛化能力的关键因素。如Figure 1所示,在SIMPLER环境中, 多个在OXE上训练的通用机器人策略在被要求"将勺子放在毛巾上"时,却一致执行"拿起可乐罐"这一仅在RT-1子数据集中存在的任务。这表明模型学习了与任务 无关的特征(如视角、背景)与动作之间的虚假相 ...