Workflow
【机械】智元发布首个通用具身基座大模型GO-1,具身智能加速进化——具身智能系列报告(二)(黄帅斌/陈佳宁/李佳琦)
光大证券研究·2025-03-11 21:03

文章核心观点 2024年底智元推出AgiBot World数据集,2025年3月10日正式发布智元通用具身基座大模型Genie Operator - 1(GO - 1),其创新性架构和特点使其在具身智能领域有显著优势,将加速具身智能普及,推动机器人向通用智能自主体发展 [2][3][4] 事件 - 2024年底智元推出AgiBot World,含超100万条轨迹、涵盖217个任务、涉及五大场景的大规模高质量真机数据集 [2] - 2025年3月10日智元正式发布智元通用具身基座大模型Genie Operator - 1(GO - 1) [2] 点评 - GO - 1从VLA进化到ViLLA创新性架构,由VLM(多模态大模型)+ MoE(混合专家)组成,VLM获通用场景感知和语言理解能力,MoE中Latent Planner获通用动作理解能力,Action Expert获精细动作执行能力 [3] - 通过实验任务测试,GO - 1相比已有最优模型成功率大幅领先,平均成功率从46%提高到78%,增加Latent Planner可提升12%的成功率(从66%到78%) [3] 小样本快速泛化,能力持续快速进化 - GO - 1借助人类和多种机器人数据使机器人学习能力泛化到各类环境和物品,快速适应新任务、学习新技能,支持部署到不同机器人本体并持续进化 [4] - 特点包括人类视频学习,结合互联网视频和真实人类示范学习,增强对人类行为理解 [4] - 特点包括小样本快速泛化,有强大泛化能力,能在极少数据甚至零样本下泛化到新场景、新任务,后训练成本低 [4] - 特点包括一脑多形,是通用机器人策略模型,能在不同机器人形态间迁移,快速适配不同本体,群体升智 [4] - 特点包括持续进化,搭配数据回流系统,可从实际执行问题数据中持续进化学习 [4] - GO - 1推出标志具身智能向通用化、开放化、智能化方向迈进,将加速具身智能普及,推动机器人从依赖特定任务工具向具备通用智能自主体发展,在多领域发挥更大作用 [4][5]