Workflow
机器人高层指挥低层做,“坐标系转移接口”一次演示实现泛化学习 | ICML2025
量子位·2025-07-22 12:35

HEP框架核心创新 - 首创"坐标系转移接口",通过层级策略学习框架解决机器人智能操作领域的数据稀缺和泛化难题 [4] - 采用分层策略结构,高层负责全局目标设定,低层在本地坐标下自主优化动作 [7] - 创新型体素编码器实现三维视觉信息高效表达,兼顾细节还原与计算速度 [2][5] 技术实现原理 - 高层策略通过预测"关键姿态"(目标3D平移)进行全局规划 [11] - 低层策略在以关键姿态为锚点的局部坐标系中生成细粒度运动轨迹 [11] - 坐标系转移接口将高层的泛化能力和抗干扰性传递到底层 [9][16] 性能表现 - 在RLBench的30个模拟任务和3个真实世界操作任务中验证有效性 [10] - 仅用30条演示数据就学会多步协作的"洗锅"任务,明显优于非分层方法 [14] - 在Pick&Place任务上实现1-shot泛化学习,数据效率显著提升 [15] - 环境变化和干扰测试下成功率较传统方法提升高达60% [17] 应用前景 - 坐标系转移接口为引入VLM或Cross-embodiment等多模态高层策略提供天然接口 [19] - 实现了高层泛化性和鲁棒性的无损传递,为多模态智能体集成与泛化部署开辟新路径 [19] - 论文已被ICML2025收录,显示学术认可度 [3]