结合采样与学习的动态全身操作
搜索文档
波士顿动力狗gogo回来了,“五条腿”协同发力
36氪· 2025-10-15 21:02
核心技术方法 - 采用结合采样与学习的动态全身操作方法,将强化学习与基于采样的控制相结合,使机器人能够执行需要手臂、双腿和躯干协同配合的动态力交互任务[1] - 研究采用分层控制方法,将控制问题划分为两个互补且同步的层级:低层基于强化学习的运动策略直接控制电机力矩,高层根据任务类型采用基于采样的控制或强化学习[2] - 在采样控制中,系统通过并行模拟多个未来情境来寻找最优操作策略,对于需要精确施力的任务会运行32个并行CPU线程,每个线程模拟未来几秒内的不同动作序列[3] - 与直接采样原始轨迹不同,研究在样条曲线空间中进行采样,能生成更平滑、更自然的运动轨迹,同时降低搜索空间的维度[5] 任务执行表现 - 机器狗Spot在轮胎扶正任务中最佳成绩为3.7秒,平均每个轮胎用时5.9秒,几乎达到人类在该任务中的操作速度[11] - 机器狗能够高效搬运重达15千克的轮胎,远超其夹持器的峰值举升能力(11千克)和持续能力(5千克),通过动态协调全身动作拓展了操作范围[13] - 在轮胎滚动任务中,利用强化学习来应对难以精确建模的复杂摩擦与接触动力学,使机器人能够动态调整躯干与手臂位置以稳定控制滚动的轮胎[7][10] 技术优势与创新 - 该方法克服了传统操作策略在不同机器人形态学结构上的迁移限制,实现了机器狗四肢与全身的协调动力学操作[1] - 系统未预设任何固定的操作模式,多肢体、多接触的行为是在采样过程中优化自然涌现的结果,而非通过显式编程设定[5] - 分层控制架构使得高层控制器能够专注于任务完成,无需显式地推理平衡约束或地面接触,显著简化了控制问题[14][15] - 训练过程中引入了随机化,包括对物体的质量、摩擦系数与形状等属性进行随机变化,以解决从仿真到现实的差距[10]
波士顿动力狗gogo回来了!“五条腿”协同发力
量子位· 2025-10-15 18:20
核心技术突破 - 波士顿动力人工智能研究所开发出“结合采样与学习的动态全身操作”方法,使机器狗Spot能够执行需要手臂、双腿和躯干协同配合的动态力交互任务[11] - 该方法采用分层控制架构,将控制问题划分为高层任务规划和低层运动执行两个互补且同步的层级[12] - 高层控制根据任务类型灵活采用基于采样的控制(用于轮胎扶正、拖拽与堆叠)或强化学习(用于轮胎滚动),低层则通过强化学习的运动策略直接控制电机力矩以实现平衡与稳定性[13][14][15] 性能表现与能力提升 - Spot机器狗最快仅用3.7秒就能搬起重达15公斤的轮胎,平均每个轮胎用时5.9秒,几乎达到人类在该任务中的操作速度[3][31] - 搬运的轮胎重量相当于Spot自身重量的一半(32.7千克),并远超其最大臂力(夹持器峰值举升能力11千克,持续能力5千克)[4][35] - 机器狗在完成任务后还能将轮胎滚动到指定位置,甚至能把一个轮胎叠到另一个轮胎上面[5][7] 方法创新与优势 - 采样控制器通过并行模拟32个CPU线程的未来情境,在样条曲线空间中进行采样以生成更平滑、更自然的运动轨迹,同时降低搜索空间的维度[17][18][20] - 系统未预设任何固定操作模式,多肢体、多接触行为是在采样过程中优化自然涌现的结果,机器人可根据当前构型动态调整使用手臂、前腿或身体等部位组合[21][22] - 分层控制架构使高层控制器无需推理数十个自由度的关节力矩与稳定性约束,仅需在简化动作空间工作,极大降低了控制复杂度[37][38] 技术实现细节 - 轮胎滚动任务采用非对称演员-评论家架构,在单块GPU上经过约24小时训练得到高层技能策略,策略能够动态调整躯干与Spot Arm位置以稳定控制轮胎[26][27][29] - 为克服仿真到现实的差距,训练过程中对物体质量、摩擦系数与形状等属性引入随机化[30] - 该方法克服了传统操作策略在不同机器人形态学结构上的迁移限制,通过动态协调全身动作拓展了操作范围[9][36]