Workflow
波士顿动力狗gogo回来了,“五条腿”协同发力
36氪·2025-10-15 21:02

核心技术方法 - 采用结合采样与学习的动态全身操作方法,将强化学习与基于采样的控制相结合,使机器人能够执行需要手臂、双腿和躯干协同配合的动态力交互任务[1] - 研究采用分层控制方法,将控制问题划分为两个互补且同步的层级:低层基于强化学习的运动策略直接控制电机力矩,高层根据任务类型采用基于采样的控制或强化学习[2] - 在采样控制中,系统通过并行模拟多个未来情境来寻找最优操作策略,对于需要精确施力的任务会运行32个并行CPU线程,每个线程模拟未来几秒内的不同动作序列[3] - 与直接采样原始轨迹不同,研究在样条曲线空间中进行采样,能生成更平滑、更自然的运动轨迹,同时降低搜索空间的维度[5] 任务执行表现 - 机器狗Spot在轮胎扶正任务中最佳成绩为3.7秒,平均每个轮胎用时5.9秒,几乎达到人类在该任务中的操作速度[11] - 机器狗能够高效搬运重达15千克的轮胎,远超其夹持器的峰值举升能力(11千克)和持续能力(5千克),通过动态协调全身动作拓展了操作范围[13] - 在轮胎滚动任务中,利用强化学习来应对难以精确建模的复杂摩擦与接触动力学,使机器人能够动态调整躯干与手臂位置以稳定控制滚动的轮胎[7][10] 技术优势与创新 - 该方法克服了传统操作策略在不同机器人形态学结构上的迁移限制,实现了机器狗四肢与全身的协调动力学操作[1] - 系统未预设任何固定的操作模式,多肢体、多接触的行为是在采样过程中优化自然涌现的结果,而非通过显式编程设定[5] - 分层控制架构使得高层控制器能够专注于任务完成,无需显式地推理平衡约束或地面接触,显著简化了控制问题[14][15] - 训练过程中引入了随机化,包括对物体的质量、摩擦系数与形状等属性进行随机变化,以解决从仿真到现实的差距[10]