智元首发SOP系统:打破离线训练瓶颈,让具身智能在“干中学”
量子位·2026-01-08 19:07

当通用能力主要通过大规模预训练获得之后,下一阶段的关键在于让已经具备通用能力的模型,在真实部署环境中持续进化。 这是智元机器人首席科学家 罗剑岚 博士在接受量子位采访时给出的论断。 智元机器人 投稿 量子位 | 公众号 QbitAI 2025年机器人领域最火的VLA让机器人通过预训练具备了相当的通用性,但与此同时,机器人能否长时间,稳定,高效地完成任务仍是一 个问号。 基于此,当机器人走出实验室,走向开放、复杂且持续变化的真实世界时,一个更核心的问题随之出现:如何真正实现通用机器人的规模化 部署与智能化运行。 为此,智元机器人具身研究中心提出 SOP(ScalableOnlinePost-training) ——一套面向真实世界部署的 在线后训练系统 。 这是业界首次在物理世界的VLA后训练中, 系统性地融合在线学习、分布式架构与多任务通才性 ,使机器人集群能够在真实环境中持续进 化,让个体经验在群体中高效复用,从而将"规模"转化为"智能"。 真实世界中的规模化智能增长挑战 要在真实世界中大规模运行,通用机器人必须同时满足两个看似矛盾的要求: 现有VLA预训练模型已经提供了强大的通用性。但 真实世界的部署受困 ...