One Hand to Rule Them All
搜索文档
不同灵巧手,终于可以共用「一套大脑」了
机器之心· 2026-03-06 14:16
行业核心问题与瓶颈 - 机器人灵巧操作领域长期面临的核心挑战是缺乏一种统一、可泛化的描述方式,导致为每种形态各异的灵巧手(手指数量、关节拓扑、自由度、驱动方式不同)都需要单独设计动作空间、采集数据并训练控制模型,这显著提高了开发成本并限制了算法的复用与规模化落地[3] - 现有方法深度依赖特定硬件设计,策略与具体手型紧密绑定,模型难以在不同手型间迁移,系统难以扩展,成为灵巧操作规模化发展的关键瓶颈[7] 提出的解决方案 - 研究团队提出了一种名为“One Hand to Rule Them All”的规范化灵巧手表示框架,旨在为不同灵巧手构建一个统一、规范且具备泛化能力的描述空间,将“手”本身作为模型的条件输入,使不同手型可以共享同一套动作表达与策略结构[5] - 该框架将具有不同自由度、手指配置和运动学结构的灵巧手,统一映射到一个共享的参数空间和标准化的URDF形式中,在保留原始手部运动学特性的同时,引入了统一的动作维度[8] - 具体方法包括:设计参数化的规范化URDF表征,固定运动学拓扑并统一坐标定义,以消除建模不一致性;采用胶囊体抽象几何以降低复杂度;引入一组紧凑且可解释的参数(如手掌尺寸、手指长度等)将手部结构表示为固定维度向量;并构建了统一的22维关节动作空间[14][16] 技术验证与实验结果 - **规范化参数的隐空间学习**:通过变分自编码器(VAE)学习手部形态的隐空间表示,潜变量连续变化时,手指数、手指长度等参数呈现平滑过渡,表明该表示能学习到连续、结构化且具有物理语义的形态流形[18] - **物理一致性验证**:在手内物体旋转任务中,规范化URDF模型与原始URDF模型表现高度接近。例如,Shadow Hand原始模型Steps-to-Fall为369.66,规范化模型为390.62;LEAP Hand原始模型Cumulative Rotation为5.63,规范化模型为6.31[20][21] - **跨手抓取策略共享**:在Allegro、Barrett与Shadow Hand三种差异显著的手型上联合训练单一抓取模型,结果显示统一训练模型在所有手型上的抓取成功率均优于独立训练模型。例如,在Allegro上,统一训练成功率为84.2%,独立训练为82.1%[25][26][27] - **零样本泛化能力**:在未见过的手型(如不同配置的LEAP Hand变体)上测试,抓取策略展现出良好的零样本泛化能力。例如,在训练中未包含leap_3033数据的情况下,在该手型上的抓取成功率为67.8%[28][29] - **真机实验验证**:在真实机器人系统(Franka机械臂、LEAP Hand)上的实验表明,基于规范化表示训练的策略能有效迁移到真实环境。例如,在leap_3333手型上对10种物体的平均抓取成功率为83%(83/100),而零样本模型在leap_3033手型上也取得了71%(71/100)的成功率[36][38] 方案优势与潜在影响 - 该规范化表示框架使数据与策略能在不同手型间高效共享,降低了对特定手型定制化设计的依赖,为跨具身学习提供了可扩展、可复用的表示基础[40] - 该方法不仅限于抓取任务,其设计原则有望推广至更广泛的机器人形态(如类人机器人、多形态末端执行器)和更复杂的操作场景,推动具身智能向更通用、可迁移的方向发展[40]