总成本1250 美元!1分钟部署!TWIST2打造低成本人形机器人数据采集方案!
机器人大讲堂·2025-11-16 13:41

文章核心观点 - TWIST2系统通过融合低成本VR设备和可拆装颈部模块,实现了便携、可扩展且具备全身控制能力的人形机器人遥操作与数据采集方案,打破了传统动捕设备的高成本和部署复杂性壁垒 [3][7][37] 技术方案对比与创新 - 传统人形机器人遥操作系统存在两难:依赖专业动捕实验室实现全身控制但无法便携部署,或追求便携性但只能实现局部身体控制 [4] - TWIST2创新性地结合"无动捕+全身控制",在便携性、可扩展性和全身控制方面均优于HOMIE、AMO、CLONE、TWIST等现有系统 [5][7] - 系统硬件成本仅约1000美元(VR设备+腿部追踪器),部署时间仅需1分钟,能以100Hz频率实时捕捉人体全身动作 [14][17] 核心组件设计 - 低成本可拆装颈部模块(TWIST2 Neck)成本仅250美元,提供2自由度(俯仰+偏航),可直接加装Unitree G1机器人,搭配400美元Zed Mini立体相机实现第一视角自主观察 [9][16] - 颈部模块配备MuJoCo仿真模型,方便研究者在虚拟环境中快速验证算法 [10] - 采用PICO 4U VR设备+2个腿部运动追踪器组合,无需第三方摄像头,灵活性更强 [14][17] 动作重定向优化 - 优化基于GMR的动作重定向算法,针对VR动捕特点改进:下半身同时优化位置和旋转约束减少脚部滑动,上半身仅优化旋转约束避免动作失真,手部将人类五指动作简化为"开合"控制适配三指手 [18][20] - 通过计算人类头部与脊柱相对旋转映射为机器人颈部角度,实现视觉跟随 [21] 数据采集效率 - 系统支持单人操作,操作员可通过PICO手柄独立控制任务启动、暂停、终止,暂停时自动插值过渡动作保障安全 [22] - 数据流频率高于50Hz,总延迟低于0.1秒(优于前代TWIST的0.5秒),操作员通过头显接收机器人第一视角立体画面 [24] - 实验显示熟练操作员20分钟内可完成98次双手抓取放置任务(成功率100%,平均每次11秒)或46次移动抓取任务(成功率100%,平均每次25秒) [25][28] 自主控制能力 - 提出分层视觉运动策略框架:底层控制器基于强化学习训练通用运动追踪器,高层控制器基于扩散模型直接预测未来2秒全身动作指令 [26] - 机器人成功自主完成全身灵巧抓取放置任务(54次尝试中49次成功到达目标位置,33次完整完成动作)和T型箱踢击任务(7次尝试中6次成功) [32][35] - 这是首个基于视觉实现人形机器人全身自主控制的框架,无需简化速度指令,直接实现关节级精准控制 [36] 系统价值与影响 - 整套系统硬件成本约1650美元(VR设备+颈部+相机),大幅降低人形机器人研究门槛 [37] - 团队已制造3个TWIST2颈部模块并开源系统、数据和模型,有望成为人形机器人研究的"基础设施" [39] - 开源方案可让研究者聚焦算法创新而非设备搭建,加速人形机器人通用化进程 [39]