Helix 02 系统核心升级 - Figure公司发布了其最新的具身大脑模型Helix 02,并展示了搭载该模型的Figure 03人形机器人完成复杂长时序家务任务的演示[1] - Helix 02的核心创新在于实现了端到端的全身统一控制,将视觉、触觉等感知统一接入,由一个系统直接输出全身动作,取代了过往上下半身分别控制的模式[6] - 新引入的System 0基于超过1000小时的人类运动数据训练,替代了之前手写的109,504行C++控制代码,负责平衡、接触处理及全身协调执行[7][19][20] 技术架构与实现细节 - Helix 02构建了一个统一的视觉—运动神经网络,即一个统一全身行走—操作的一体化VLA模型,将机载全部传感器直接接到所有执行器,实现“感觉、思考、行动”一体化[15][16][17] - 系统采用三层紧密层级架构:System 2负责高层语义推理与任务拆解;System 1以200Hz频率将感知转化为全身关节目标;System 0以1kHz频率执行,负责稳定协调[19] - System 1是一个约1000万参数的神经网络,输入全身关节状态与基座运动信息,在超过20万个并行仿真环境中训练,实现了从像素到全身的控制[26][27] - 首次将手掌摄像头与指尖触觉传感器输入引入神经网络控制策略,触觉传感器灵敏度可感知低至3克的力,增强了在遮挡情况下的操作与精细力控能力[11][28][30] 演示任务与性能突破 - Figure 03在家庭厨房中自主完成了从洗碗机取盘并放入橱柜的整套流程,任务时长近4分钟,包含行走、抓取、搬运、放置等61个连续操作,全程无重置、无人工干预、无遥操作[5] - 公司称这是迄今为止人形机器人自主完成的时间跨度最长、复杂度最高的任务[6] - 展示了四项结合触觉与手内视觉的精细灵巧操作:拧开瓶盖、从药盒中取出单颗药片、用注射器精确推出5ml液体、从杂乱箱中取出金属零件[42] - 从杂乱箱中取金属零件的演示实际来自其BotQ制造工厂的零件卸载过程,展示了工业应用潜力[53] 行业趋势与竞争定位 - 此次突破标志着行业技术焦点从将行走与操作拆分为独立控制器并“缝合”的传统方案,转向需要移动与操作同时发生的全身控制Loco-Manipulation[59][60][67] - 前卡内基梅隆大学机器人研究员指出,Figure抛弃了过时的全身模型预测控制,转向了现代的人类到类人的强化学习全身控制[8] - 行业观点认为,面向人形机器人的全身控制VLA已成为“入场门槛”,具身智能的主战场正从静态桌面转向需要持续平衡、移动与操作协同的真实世界[72][77] - 其他团队如智元Agibot X2也已在大尺度空间中实现端到端移动操作任务,表明这是行业共同推进的方向[75] - Sunday机器人工程师评价此为迄今为止见过最好的机器人全身控制,并指出足式控制的难度高于轮式方案[13][70]
Figure抛弃10万行C++代码!用1000小时人类数据训练神经网络,实现全身控制基础模型
量子位·2026-01-28 21:33