文章核心观点 - 由香港大学、NVIDIA和清华大学联合提出的AMS统一人形机器人全身控制框架,首次在单一策略中同时实现了动态运动跟踪和极限平衡控制能力,解决了该领域的“两难困境” [3][5] AMS框架解决的核心挑战 - 人形机器人需要同时具备敏捷的动态运动和精确的平衡控制,但现有方法难以在统一框架中实现两者 [5][7] - 现有研究主要分两个方向:动态运动跟踪(如跳舞、跑步)和平衡控制(如单腿平衡),两者难以统一 [8][10] - 难以统一的原因主要有两方面:一是依赖人类动作捕捉数据存在“长尾分布”问题,极端平衡场景数据不足;二是动态运动与平衡控制的优化目标存在冲突 [12][13] AMS框架的三个关键创新 异构数据源 - 核心思路是从机器人动作空间直接采样生成可扩展的平衡数据,突破人类数据限制 [2] - 该方法避免了手动收集人类动作数据的限制,通过采样生成合成平衡动作数据 [16] - 优势包括:保证物理可行性、可扩展性强、能生成人类难以完成的极限平衡动作,充分挖掘机器人独特的机械能力 [16] - 整合人类动捕数据与合成平衡动作,有效缓解数据长尾分布问题,使策略能零样本跟踪如“叶问蹲”等未见过的极端平衡动作 [19][20] 混合奖励机制 - 选择性应用平衡先验奖励,精准提供平衡指导而不牺牲敏捷性 [2] - 设计包含通用奖励(应用于所有数据,鼓励鲁棒运动跟踪)和平衡先验奖励(仅应用于合成平衡数据,提供物理先验引导) [21] - 该设计使策略既能从人类动作中学习敏捷行为,又能在挑战性姿态中保持稳定,化解了优化目标冲突 [21] 自适应学习策略 - 动态调整采样概率,同时对每个动作“因材施教”,实现高效的自适应学习 [2] - 包含两个关键组件:自适应采样(根据跟踪性能动态调整运动序列采样概率,实现困难样本挖掘)和自适应奖励调整(为每个运动维护特定的误差容忍度参数) [23] 实验结果与能力展示 - 在Unitree G1人形机器人上的真机实验表明,AMS统一策略能够实现多种能力 [24] - 动态运动跟踪:能够流畅执行折返跑、篮球运球、武术等多种高动态动作 [24][26] - 极限平衡控制:得益于可扩展的合成平衡动作数据,展现了精确的平衡控制能力,能完成随机采样生成的单腿平衡动作 [26][28] - 实时遥操作:支持基于惯性动捕和基于RGB相机的多种实时遥操作模式,展示了其作为基础控制模型的实用价值 [29][31][33]
人形机器人新突破!敏捷稳定两不误
具身智能之心·2025-12-05 08:02