端到端视觉 - 语言 - 动作模型 - 财报，业绩电话会，研报，新闻 - Reportify

端到端视觉 - 语言 - 动作模型

搜索文档

人形机器人终于学会洗碗了

量子位· 2025-09-04 12:41

文章核心观点 - Figure机器人展示了其通用人形机器人Figure 02在无需新算法或特殊工程的情况下，仅通过增加新数据即可掌握洗碗机餐具装载这一新技能 [4][20][25] - 这表明公司基于Helix架构的机器人正朝着可扩展的通用智能方向迈进，同一系统通过数据驱动即可逐步学习多样化任务 [25] Helix架构技术特点 - Helix架构是公司与OpenAI分道扬镳后开发的第一个成果，是一个端到端的"视觉-语言-动作"模型，使机器人能像人类一样感知、理解和行动 [21] - 该架构采用单一统一模型，仅使用一组神经网络权重即可在各种任务中实现强大性能，包括精准拾取放置物品、操控抽屉与冰箱、协调多机器人灵巧交接以及操控数千种新物体 [24] - 架构由两个经过端到端训练并可通信的系统组成，能够处理洗碗机装载、包裹分拣和毛巾叠放等看似不相关的任务 [22][25] 机器人技能展示与性能 - 在洗碗机装载任务中，机器人掌握了从杂乱堆叠中分离餐具、重新调整角度、双臂协同传递、处理光滑易碎物品的指尖级精细操作等技能 [16][17][26] - 机器人具备应对不同装载情境的能力，能够适应新奇的餐具、凌乱的初始摆放和突发的碰撞，并保持稳定可靠的表现 [18][19][26] - 此前，机器人已展示过长达一小时的物流场景包裹分拣能力，其操作灵活性和速度已接近人类水平，并能完成叠毛巾和衣服的任务 [7][9] 技术实现路径与行业意义 - 机器人新技能的获取完全依赖于数据驱动，无需新的算法或特殊的工程设计，凸显了公司以数据为核心的技术扩展路径 [4][20] - 这种通过单一通用架构处理多样化任务的能力，标志着人形机器人行业在实现可扩展的通用智能方面取得了实质性进展 [25]

通用人形智能

端到端视觉 - 语言 - 动作模型

Figure机器人

通用人形智能

端到端视觉 - 语言 - 动作模型

Figure机器人