Workflow
Figure人形机器人首秀灵巧手叠衣服!神经网络架构不变,只增加数据集就搞定
量子位·2025-08-13 17:13

核心观点 - Figure人形机器人通过Helix架构实现端到端神经网络控制,在不改变架构仅增加数据的情况下,成功从物流分拣扩展到叠衣服等高难度灵巧操作任务 [1][14][21] - 叠衣服任务展示了机器人对高度可变性物体的处理能力,包括实时边缘追踪、褶皱调整和多模态交互(眼神/手势) [6][18][21] - Helix架构整合视觉记忆、状态历史和力反馈系统,使机器人具备环境感知、动作连续性和动态调整能力 [23][24][27][28] 技术突破 任务扩展性 - 同一模型两个月前完成物流包裹分拣(处理数千种物体,成功率接近人类水平),现直接迁移至叠衣服任务,无需修改架构或超参数 [12][14][21] - 叠衣服难度显著高于刚性物体操作:需应对无固定几何形状、易变形缠结等特性,依赖实时视觉反馈和毫米级手指控制 [15][16][17] Helix架构特性 - 多模态处理:统一模型处理视觉/语言输入到运动控制的端到端流程,支持任务间知识迁移 [8][22] - 视觉记忆系统:通过视频帧特征组合形成短期记忆,避免重复操作(如包裹分拣时记忆已检查面) [24][25][26] - 状态历史机制:分块执行动作序列并保留上下文,使纠错延迟缩短50%以上(包裹抓取失败时快速恢复) [27][28] - 力反馈闭环:实时调整运动轨迹(如检测传送带接触后暂停下压),提升操作成功率30% [28][29] 行业对比 - 该机型为首个采用多指手完成端到端衣物折叠的通用人形机器人 [21] - 竞品如擎天柱10个月前已实现类似功能,但未展示多任务迁移能力 [9][31] - 近期WRC展会上其他机器人仅能完成单一家务(抓娃娃等),而Figure已覆盖分拣/折叠/洗衣等多场景 [33] 发展计划 - 未来重点扩大现实世界数据规模,提升灵活性/速度/泛化能力 [20] - 持续优化Helix在非结构化环境中的表现,探索更多家庭服务场景 [22][33]