数据手
搜索文档
机器人版GPT-3来了:任务成功率99%,「涌现」过后能临场发挥
机器之心· 2026-04-03 20:08
GEN-1 模型性能突破 - 新一代基础模型GEN-1在多项任务中成功率高达99%,较上一代Gen-0的平均64%成功率有显著提升 [3] - 模型能够实现连续数百次运行而无需人工干预,在工业场景中实现了从“大概率成功”到“每次都能成功”的可靠性跨越 [3][4] - 执行效率大幅提升,以箱体折叠任务为例,执行时间从34秒缩短至12秒,速度提升约3倍 [7] GEN-1 核心能力演进 - 模型展现出“物理常识”能力,能够在长流程任务中应对意外情况并自主调整策略,例如在汽车零件装配中处理抓不稳的垫圈 [9] - 对于软质、易变形的大物体,即使形状变得“奇怪”超出预期,模型也能自主设法恢复到可操作状态 [10] - 这些应对长尾情况的“临场发挥”行为并未包含在原始训练数据中,标志着机器人开始从单纯“执行”向“理解如何执行”演进 [11][12] 技术路径与数据策略 - GEN-1的训练基于超过50万小时的人类演示数据,这些数据通过佩戴动捕设备在真实环境中采集 [14][16] - 公司将机器人视为可持续扩展的模型系统,通过扩大模型规模、堆叠数据和反复迭代来逼近通用能力,其路径与依赖模拟数据的Physical Intelligence公司形成对照 [14][17] - 行业共识认为机器人发展的主要瓶颈在于数据而非模型,现实世界缺乏系统性的可抓取数据源 [14][15] - 公司的解决方案是设计“数据手”设备,将人直接转化为数据系统,在家庭、仓库等真实场景中记录视觉和动作信息,目标是让AI学会跨场景的能力迁移 [16] 行业范式与资本动态 - 当前机器人领域正经历范式切换,从“被编排执行任务”转向“通过数据学习如何应对世界” [21] - 行业观点认为,当模型、数据与算力叠加跨越某个阈值时,机器人将迎来类似ChatGPT早期的能力跃迁时刻 [14][22] - 资本已率先行动,Generalist公司在2025年完成1.4亿美元融资,估值达4.4亿美元,投资者包括Spark Capital、英伟达NVentures、贝佐斯探险公司等 [19] - 与此同时,同行公司Physical Intelligence被曝估值接近百亿美元,行业热度显著提升 [20]