人形机器人自主控制新突破:VLA驱动全身协同,行走与操作同时完成
核心观点 - 联合研究团队提出了一种名为WholeBodyVLA的新框架,旨在实现人形机器人对装箱、搬运、推车等需要移动与操作协同的全身控制任务,这为将视觉-语言-动作(VLA)范式扩展至双足人形机器人全身控制提供了可行路径 [1][2] 技术突破与框架特点 - 该框架基于智元灵犀X2研究发布,将视觉-语言-动作(VLA)扩展至双足人形机器人的全身控制,并验证了其在全身移动操作任务中的可行性 [1] - WholeBodyVLA通过从人类第一视角视频中学习移动与操作的潜在动作表示,以降低对昂贵机器人遥操作数据的依赖 [1] - 研究团队设计了一种面向移动操作的强化学习控制器,通过简化控制目标来提升运动执行的稳定性 [1] 实验验证与性能表现 - 实验验证显示,该框架使机器人能在不同起始位置走向目标并完成操作,并对场景和物体表现出一部分泛化能力 [2] - 该框架在干扰地形上也能保持机器人的基本移动方向与平衡 [2]