Workflow
导航动作分块transformer(Nav-ACT)
icon
搜索文档
X-Nav:端到端跨平台导航框架,通用策略实现零样本迁移
具身智能之心· 2025-07-22 14:29
点击下方 卡片 ,关注" 具身智能 之心 "公众号 作者丨 Haitong Wang等 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要 的。 写在前面&概述 现有导航方法多针对特定机器人形态设计,导致在不同平台间的通用性受限。为此,本文提出的X-Nav框 架实现了端到端跨形态导航,单一通用策略可部署于轮式和四足机器人。其核心是两阶段学习机制:先通 过深度强化学习(DRL)在大量随机生成的机器人形态上训练多个专家策略,再借助导航动作分块 transformer(Nav-ACT)将这些专家策略提炼为单一通用策略,最终实现对未知形态机器人和逼真环境的零 样本迁移。 核心问题与现有局限 导航任务要求机器人从起始位置到目标位置,在未知复杂环境中完成无碰撞移动,依赖视觉观测(深度图 像)、目标位置和本体感受(如关节位置、速度)等信息。但现有方法存在明显局限: 阶段1:专家策略学习 在随机生成的机器人形态上,用DRL训练多个专家策略。 | | | | | TABL ...