RoboTwin 2.0

搜索文档
RoboTwin系列新作:开源大规模域随机化双臂操作数据合成器与评测基准集
机器之心· 2025-07-07 15:50
核心观点 - RoboTwin 2.0 是一个开源的大规模域随机化双臂操作数据合成器与评测基准集,包含50个任务的评测基准和5款本体的支持 [8][23] - 该系统通过多模态大模型与仿真闭环优化专家代码生成,显著提升任务执行效率与成功率 [10][25] - 构建了包含147类731个物体的RoboTwin-OD数据集,为复杂场景提供丰富语义支持 [12][14] - 引入系统化域随机化策略,从5个维度增强模型鲁棒性 [16] - 实验表明该系统可显著提升双臂机器人在真实环境中的迁移性能 [30][33] 技术架构 专家代码生成 - 提供更精简易用的API库,降低多模态模型生成代码门槛 [10] - 结合关键帧视觉观测和实时反馈迭代优化代码,平均成功率从47.4%提升至71.3% [25][27] - 迭代次数从2.46次降至1.76次,LLM token消耗显著降低 [27] 物体数据集 - RoboTwin-OD包含147类731个实例,其中534个通过AIGC生成并优化 [12] - 精细标注操作点、方向及多级语义信息 [12] - 支持复杂场景布置和大规模任务设计 [12][14] 自适应抓取 - 为5种本体构建差异化抓取候选集 [15] - 平均成功率提升8.3%,低自由度平台提升更显著(Piper平台+22.7%) [28] 域随机化策略 - 场景杂乱:随机加入干扰物体并进行语义分组 [18] - 背景纹理:构建12000种高质量纹理库 [19] - 光照条件:随机化光源类型、数量、颜色等参数 [20] - 桌面高度:在合理范围内均匀采样 [21] - 语言指令:通过大模型生成多样化任务描述 [22] 性能表现 仿真环境 - 在32项任务9600条数据上微调,为RDT模型带来71.6%相对提升 [30] - 典型任务平均成功率从47.4%提升至62.1% [27] 真实迁移 - 引入1000条合成数据后,四种测试配置成功率提升13.5%-33.0% [33] - 纯合成设置下仍能取得20%以上的成功率提升 [33] 开源生态 - 代码获1.2k Github Stars,包含50个任务实现 [3][36] - 提供10万+条预采集操作数据和完整物体资产库 [37] - 配套用户友好文档和示例 [9][37] 行业影响 - 作为CVPR 2025等多项赛事的官方赛题 [3] - 吸引64支队伍400+人次参与相关竞赛 [39] - 优胜方案包含SEM和AnchorDP3等创新算法 [39]
穆尧团队最新!RoboTwin 2.0:用于鲁棒双臂操作的可扩展数据基准
自动驾驶之心· 2025-06-24 20:41
核心观点 - RoboTwin 2.0是一个可扩展的仿真框架,旨在解决双臂机器人操作中数据生成和仿真环境简化两大挑战,通过自动生成多样化且逼真的数据提升策略鲁棒性[2] - 该框架引入五个维度的结构化域随机化(杂乱程度、光照、背景、桌面高度和语言指令),显著增强数据多样性和策略泛化能力[4] - 在50个双臂任务中预收集超过10万条域随机化专家轨迹,覆盖五种机器人实体,实证显示代码生成成功率提高10.9%,真实任务性能提升367%[4] 方法创新 自动专家代码生成 - 结合多模态大语言模型(MLLMs)与仿真闭环优化,通过代码生成agent和视觉-语言模型观察者的双AI agent架构实现迭代优化[10] - 在10项任务评估中,RoboTwin 2.0+MM FB配置达到71.3%的成功率,较基础版本提升23.9个百分点[27] 域随机化设计 - 场景杂乱:基于147类别731个标注物体的RoboTwin-OD库生成语义丰富的干扰场景[12] - 光照变化:随机化色温、光源类型(点光源/区域光源)等参数模拟现实光照条件[13] - 语言指令:通过MLLMs自动生成多样化任务指令和物体描述,覆盖几何/外观/部件级属性[13] 实体感知适应 - 为不同自由度机器人(7-DoF/6-DoF)定制抓取策略,使低自由度平台成功率提升13.5%-22.7%[29] - 通过标注物体关键点轴信息(抓取点/功能点)支持跨实体部署,平均任务成功率提高8.3%[16][31] 数据集与基准 RoboTwin-OD物体库 - 包含147类别731个实例,其中534个通过RGB到3D重建生成,均标注语义和操作相关标签(放置点/抓取轴)[18] 预收集数据集 - 覆盖50项双臂任务和5种机器人实体,包含10万+轨迹(每任务100条干净轨迹+400条随机化轨迹)[24] 性能验证 - 仿真到现实迁移:添加1,000条RoboTwin 2.0合成轨迹使现实任务成功率最高提升33个百分点[36] - 基准测试显示预训练模型(如RDT)在Hard条件下保持优势,非预训练模型性能下降显著[37]