Workflow
Helix架构
icon
搜索文档
Figure人形机器人首秀灵巧手叠衣服!只增加数据集就搞定
具身智能之心· 2025-08-15 08:05
人形机器人技术突破 - Figure人形机器人通过神经网络学习叠衣服技能,无需架构改变仅增加数据即可完成新任务[2][7] - 机器人具备自然交互能力,包括眼神交流、点头和手势反馈[4][5] - 叠衣服任务采用端到端方式运行,从视觉语言输入到运动控制完全自主[9] 技术挑战与解决方案 - 叠衣服是极具挑战性的灵巧操作任务,需处理易变形、形状多样的物体[15][16] - 机器人需精细协调手指控制以追踪边缘、捏住角落并实时调整[17][18] - Helix架构是关键,作为端到端"视觉-语言-动作"模型实现通用人形机器人控制[21] Helix架构技术细节 - 由视觉记忆、状态历史和力反馈三部分组成[23][26][29] - 视觉记忆模块可从视频帧组合特征形成短期记忆[23][24] - 状态历史通过动作分块确保模块间连续性和稳健性[26][27] - 力反馈实现触感,帮助动态调整运动过程[29][30] 应用场景扩展 - 同一模型从物流分拣扩展到叠衣服任务,展现强大泛化能力[12][14] - 机器人已掌握洗衣服、叠衣服等家务技能,接近完成家务闭环[36][38] - 技术可应用于多种场景,包括物流、家庭服务等[12][38] 行业进展对比 - 擎天柱机器人10个月前已具备叠衣服能力[10][32] - WRC展会上也有类似功能的机器人展示[34] - Figure机器人技术持续迭代,在灵活性、速度和泛化能力方向持续提升[20]
Figure人形机器人首秀灵巧手叠衣服!神经网络架构不变,只增加数据集就搞定
量子位· 2025-08-13 17:13
核心观点 - Figure人形机器人通过Helix架构实现端到端神经网络控制,在不改变架构仅增加数据的情况下,成功从物流分拣扩展到叠衣服等高难度灵巧操作任务 [1][14][21] - 叠衣服任务展示了机器人对高度可变性物体的处理能力,包括实时边缘追踪、褶皱调整和多模态交互(眼神/手势) [6][18][21] - Helix架构整合视觉记忆、状态历史和力反馈系统,使机器人具备环境感知、动作连续性和动态调整能力 [23][24][27][28] 技术突破 任务扩展性 - 同一模型两个月前完成物流包裹分拣(处理数千种物体,成功率接近人类水平),现直接迁移至叠衣服任务,无需修改架构或超参数 [12][14][21] - 叠衣服难度显著高于刚性物体操作:需应对无固定几何形状、易变形缠结等特性,依赖实时视觉反馈和毫米级手指控制 [15][16][17] Helix架构特性 - 多模态处理:统一模型处理视觉/语言输入到运动控制的端到端流程,支持任务间知识迁移 [8][22] - 视觉记忆系统:通过视频帧特征组合形成短期记忆,避免重复操作(如包裹分拣时记忆已检查面) [24][25][26] - 状态历史机制:分块执行动作序列并保留上下文,使纠错延迟缩短50%以上(包裹抓取失败时快速恢复) [27][28] - 力反馈闭环:实时调整运动轨迹(如检测传送带接触后暂停下压),提升操作成功率30% [28][29] 行业对比 - 该机型为首个采用多指手完成端到端衣物折叠的通用人形机器人 [21] - 竞品如擎天柱10个月前已实现类似功能,但未展示多任务迁移能力 [9][31] - 近期WRC展会上其他机器人仅能完成单一家务(抓娃娃等),而Figure已覆盖分拣/折叠/洗衣等多场景 [33] 发展计划 - 未来重点扩大现实世界数据规模,提升灵活性/速度/泛化能力 [20] - 持续优化Helix在非结构化环境中的表现,探索更多家庭服务场景 [22][33]