捷径学习

搜索文档
探究下VLA模型泛化差的原因......
具身智能之心· 2025-08-20 08:03
点击下方 卡片 ,关注" 具身智能 之心 "公众号 在大规模数据集(如 Open X-Embodiment,简称 OXE)上训练的通用机器人策略在各类任务中表现出较强性能。然而,它们往往难以超出训练数据的分布范围进行 泛化。 本文探究了这种泛化能力受限的根本原因, 发现捷径学习 —— 即对与任务无关特征的依赖 —— 是阻碍泛化的关键因素。 通过全面的理论与实证分析,我们揭示 了导致捷径学习的两个主要原因:(1) 单个子数据集内部多样性有限 ;(2) 子数据集之间存在显著的分布差异,进而导致数据集碎片化 。 这些问题源于 OXE 等大规模数据集的固有结构 —— 这类数据集通常由多个子数据集构成,而这些子数据集是在不同环境和机器人形态下独立收集的。 我们的研究结果为改进机器人数据集收集策略提供了重要见解,有助于减少捷径学习并提升通用机器人策略的泛化能力。此外,在获取新的大规模数据不切实际的 场景中,本文证实, 精心选择的机器人数据增强策略能够有效减少现有离线数据集中的捷径学习,从而提升通用机器人策略(如 )在仿真和真实环境中的泛化 能力 。 论文标题 : Shortcut Learning in Generali ...
探究具身机器人有限泛化能力的本质原因!增强策略依然有效
具身智能之心· 2025-08-12 08:03
点击下方 卡片 ,关注" 具身智能 之心 "公众号 作者丨 Youguang Xing等 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要的。 研究背景与核心问题 近年来,随着大规模机器人数据集(如Open X-Embodiment/OXE)和高容量模型的发展,通用机器人策略在多种任务上展现出强大能力。然而,这些策略在面对训 练数据分布之外的场景时,泛化能力仍然有限。有趣的是,这种限制不能简单归因于数据量不足——OXE包含超过一百万段轨迹,远超典型视觉语言模型训练数 据集的规模。 研究者发现, 捷径学习 (shortcut learning)——模型依赖任务无关特征而非真正因果关系——是限制泛化能力的关键因素。如Figure 1所示,在SIMPLER环境中, 多个在OXE上训练的通用机器人策略在被要求"将勺子放在毛巾上"时,却一致执行"拿起可乐罐"这一仅在RT-1子数据集中存在的任务。这表明模型学习了与任务 无关的特征(如视角、背景)与动作之间的虚假相 ...