文章核心观点 - 提出TrajBooster创新框架 利用轮式机器人操作数据通过轨迹重定向技术提升双足人形机器人动作学习效率 [1] - 该方法仅需10分钟目标机器人真实数据即可实现复杂全身操控任务 显著增强机器人动作空间理解和零样本任务迁移能力 [1] - 代表解决机器人数据稀缺问题新思路 通过跨形态共享与模拟增强最大化现有数据集价值 [19] TrajBooster核心思想 - 以6D末端执行器轨迹作为与机器人形态无关的通用接口 实现跨形态教学 [2] - 整体流程为真实→模拟→真实闭环 从轮式机器人数据提取轨迹 在仿真中教双足机器人追踪 最后用真实数据微调 [2][4] - 将轮式机器人任务知识通过轨迹中介传递给双足机器人 双足机器人只需学习用自身身体执行轨迹 [4] 精准全身重定向实现 - 采用分层控制模型 上层逆运动学模块负责手臂 直接根据目标手腕位姿计算臂部关节角度 [5] - 下层分层RL策略负责腿部和平衡 包含管理者策略决策身体移动和执行者策略转化具体关节动作 [8] - 设计协调在线DAgger算法 在平衡探索与记忆同时通过梯度下降优化策略 实现更精准轨迹跟踪性能 [8] 从模拟到现实训练 - 后预训练阶段将重定向动作数据与源语言视觉组合 用合成数据对预训练VLA模型进行继续预训练 [9] - 让模型初步理解目标机器人动作空间 学习语言指令和视觉观察对应双足机器人全身动作模式 [10] - 后训练阶段仅收集10分钟目标机器人真实数据对模型微调 弥合模拟到真实差距 [11] 实验结果 - 在抓取米老鼠、整理玩具等任务中 经过后预训练加3千步后训练的模型性能显著优于直接使用1万步真实数据训练的模型 [12] - 经过后预训练的模型能够零样本完成传递水杯任务 成功将轮式数据中技能迁移到双足机器人 [15] - 当目标物体放置于训练未见位置时 经过后预训练的模型成功率80% 远高于未经过后预训练模型的0% [16]
跨形态学习来了!轮式机器人的“经验”如何轻松传给双足机器人?
机器人大讲堂·2025-09-23 21:24