Workflow
全身视觉运动控制策略
icon
搜索文档
机器狗能当羽毛球搭子了!仅靠强化学习从0自学,还涌现出类人回位行为 | Science子刊
量子位· 2025-05-30 15:10
机器狗羽毛球技术突破 - 基于强化学习的全身视觉运动控制策略同步控制18个自由度的腿部移动和手臂挥拍动作[4] - 最高挥拍速度达12米/秒,与人类业余选手协作时实现单回合连续击球10次[5][6][23] - 在发球区拦截成功率接近100%,但正上方/后方来球拦截仍存在挑战[29][30][31] 硬件与感知系统配置 - 采用ANYmal-D四足底座+DynaArm动态手臂组合,配备ZED X立体相机(400Hz控制频率/100Hz策略更新)[13][16] - 球拍45°腕关节定向经仿真验证为最优配置,感知模块平均轨迹判断耗时0.357秒[15][20] - Jetson AGX Orin模块以60Hz异步运行轨迹预测系统,击球位置误差0.117米(12m/s挥拍时)[17][37] 运动控制性能 - 10m/s指令速度下跟踪精准,超10m/s时精度下降,实测最高执行速度12.06m/s(指令19m/s)[34][35] - 动态调整步态:短距微调/中距不规则步态/长距类疾驰步态,远距拦截采用快跑模式[38][39] - 击球后自动回位中心的行为涌现,模拟人类球员站位调整策略[25][26] 算法创新与局限 - 统一强化学习策略解决18自由度协同控制问题,突破传统固定基座方案局限[47][48] - 感知噪声模型缩小仿真与部署差距,较基准降低28%感知误差(无显式视野奖励)[51][56] - 当前依赖单一立体相机EKF估计,未来可通过扭矩/声音/RGB-D等多模态传感升级[58][59] 学术价值与场景拓展 - 苏黎世联邦理工学院团队成果发表于《Science Robotics》,验证足式机器人在动态体育场景的可行性[8][10][11] - 系统在电流/关节速度极限下运行,为复杂环境中的移动操作任务建立新基准[35][47] - 技术框架可扩展至其他需要动态协调的运动场景,如应急响应或服务业[47][58]