Workflow
DexManip框架
icon
搜索文档
零样本 Sim-to-Real !实现五指灵巧手力控抓取与手内操作
机器之心· 2026-03-24 20:29
文章核心观点 - 字节跳动Seed团队的研究论文提出了一套完整的Sim-to-Real强化学习框架,旨在解决机器人灵巧操作中仿真与现实之间的“现实鸿沟”问题,实现了在纯仿真环境中训练的策略能够零样本部署到真实五指灵巧手上,无需额外真实数据微调 [2] 三大核心技术:打通从仿真到现实的感知与驱动链路 - **计算高效的触觉仿真**:提出基于距离场的快速触觉仿真方法,通过并行正向运动学计算虚拟触觉单元阵列与物体表面的距离,提供强化学习所需的高频信号和关键接触信息(如接触力大小和受力加权接触中心),在保证物理合理性的同时极大提升了仿真效率 [7] - **电流-力矩校准**:针对商用灵巧手缺乏关节级力矩传感器的问题,通过数据驱动的电流-力矩校准机制,在准静态条件下拟合电机电流与接触力、仿真力矩与接触力的线性关系,建立可靠的“电流到力矩”映射,从而在无需物理力矩传感器的情况下实现对交互力的显式感知和控制 [10][12] - **执行器动力学建模与随机化**:在仿真中显式建模真实电机的非理想特性(如齿轮间隙、力矩-速度饱和及摩擦力),并对关键参数(如堵转力矩、空载速度、齿轮间隙阈值等)进行广泛的域随机化,迫使控制策略适应各种硬件缺陷和公差变化,显著提高了Sim-to-Real转移的鲁棒性 [13] 全状态策略与创新训练范式:实现力控自适应抓取与手内物体旋转 - **倒置“接物”训练范式**:提出创新的倒置“接物”训练设置,灵巧手心向上固定,物体从上方随机掉落,利用重力自然将物体引入工作空间,简化探索过程,使策略专注于学习手指协调和接触后的力调节,并鼓励形成包络式、多点接触的稳定抓取姿态 [16] - **力自适应抓取**:策略根据用户输入的力指令动态调节各手指抓取力,结合接触力惩罚和关节力矩惩罚的复合奖励函数是实现稳健力控的关键,使策略能同时协调关节驱动和指尖接触,实现与指令高度线性相关的精准力控 [17] - **手内物体旋转**:任务要求策略通过协调的手指步态在保持稳定接触的同时将物体绕指定轴旋转,消融实验表明,包含受力加权接触中心、接触力和6D姿态表示的完整观测配置取得最佳性能(平均连续成功25.1次),移除任何触觉信息会导致性能显著下降,无触觉反馈的基线策略几乎无法完成任务(平均成功1.1次),证明了高分辨率触觉反馈在复杂手内操作中的不可替代性 [19] 星动纪元五指灵巧手星动XHAND1:DexManip零样本部署的硬件核心支撑 - **270°环绕指端高分辨率触觉阵列**:星动XHAND1在每个手指端配备270°环绕的高分辨率触觉阵列传感器(单指 > 100个触觉点),能无死角捕捉物体在指尖滚动、滑动时的微小接触变化,结合高精度的力觉精度和三维力触觉感知能力,为策略提供丰富且精准的观测输入 [25] - **高精度URDF与触觉仿真模型的无缝对接**:星动XHAND1官方提供极高精度的URDF模型,精确描述运动学连杆、动力学参数并完美映射真实传感器空间分布,使得仿真中计算的虚拟触觉单元能与真实传感器阵列实现1:1精准对齐,大幅降低Sim-to-Real的现实鸿沟 [26] - **全直驱架构与电流-力矩校准的完美契合**:星动XHAND1采用的全直驱电机架构消除了传统减速器带来的摩擦、迟滞和非线性干扰,使电机相电流与输出力矩保持极高线性相关性,这不仅让电流-力矩校准过程更精确可靠,还赋予了灵巧手高力控带宽和超灵敏动态响应能力,能根据10%、50%、100%等不同指令瞬间精准调节抓取力度 [27]