迪士尼机器人「摔跤」也内卷:不仅要摔得轻,还要摔得帅!AI新研究把Bug玩成绝活

核心观点 - 迪士尼研究院提出了一种名为“机器人速成班:学习柔软且风格化的摔倒”的全新方法,其核心思想是让机器人不仅能摔得“软”以减少损伤,还能摔得“帅”以摆出指定艺术姿势,从而将潜在事故转化为可控表演,并为机器人安全和快速恢复提供新方案 [2] 技术原理 - 该技术基于一个精心设计的强化学习框架,通过模拟环境中的“摔跤”训练和复杂的“奖励函数”来引导AI学习 [3] - 奖励函数同时关注“冲击最小化”和“姿态跟踪”两个核心目标,通过惩罚接触力过大的碰撞来鼓励“软着陆” [4] - 引入“身体部位敏感度权重”以保护核心部件,例如头部权重设为4.0,肩膀为3.0,腿部为1.0,引导AI优先保护关键部位 [6] - 通过时间调制机制平衡冲突目标:摔倒初始阶段优先考虑冲击最小化,稳定后逐渐增加姿态跟踪权重,引导机器人平滑过渡到最终造型 [8] - 整个过程类似于武术中的“受身”或柔道中的“UKEMI”技术,是主动利用滚动和身体姿态化解冲击力 [9] 数据生成与训练 - 研究团队利用NVIDIA Isaac Sim物理仿真平台进行大规模并行仿真,以高效生成多样化训练数据 [11] - 数据生成步骤:在关节限制内随机生成大量身体姿态;将机器人从低高度(如4厘米)释放进行“自由落体”模拟;记录最终静止的稳定姿态作为目标结束姿势 [11] - 此策略生成了数以万计符合物理规律的静态稳定摔倒姿势,并确保数据多样性,避免某些姿势被过度采样 [11] - 使用大规模生成数据集训练的模型展现出强大的泛化性能和鲁棒性,远优于仅用10个艺术家设计姿势训练的模型 [12][13] 实验验证与效果 - 研究团队在一个定制的高0.84米、重16.2公斤的双足机器人上进行了实地测试,模拟各种突发摔倒情况 [15] - 与传统的“零力矩”、“低增益”或“高增益”摔倒方式相比,新算法使机器人表现出无与伦比的控制力 [16] - 新方法产生的最大冲击力和平均冲击力相比其他方法实现断崖式下降,且方差极小,表明每次摔倒都非常稳定可控 [16] - 在真实世界实验中,机器人能流畅、可控地接触地面并稳稳停在预设艺术造型上,所有实验后机器人均毫发无伤 [16][17] 应用前景与意义 - 该技术为机器人领域开辟了新方向,未来可用于娱乐行业的特技机器人,上演高难度夸张动作 [17] - 也可用于工业、救援等领域机器人,使其在崎岖地形中不慎摔倒时能最大程度自我保护并快速恢复工作 [17] - 研究将潜在的机器人摔倒事故转化为一场充满力量与美的“可控表演” [20]