具身智能的「GPT时刻」?高德连发两个全面SOTA的ABot具身基座模型
机器之心·2026-02-12 18:08

文章核心观点 - 阿里巴巴旗下高德发布的ABot系列具身基座模型,标志着具身智能行业正经历从“碎片化定制”到“底座化复用”的范式跃迁,类似于GPT对NLP领域的重塑[3][4] - ABot系列通过提供统一的动作表示和空间建模底座,解决了机器人行业长期存在的数据割裂、模型无法复用、泛化能力差等结构性瓶颈,为机器人进入开放物理世界提供了可能[4][7] - 高德凭借其在地图与位置服务领域超过20年积累的大规模真实3D场景数据、空间语义资产以及亿级用户工程落地经验,构建了难以复制的数据与工程护城河,从而率先跑通具身智能底座[11][35][36] 行业背景与瓶颈 - 当前机器人行业处境类似2019年之前的NLP领域,不同形态、不同场景的机器人使用各自独立的动作表示体系,数据互不兼容,模型无法复用,能力无法迁移[1][2] - 具身智能长期缺失“统一底座”,核心瓶颈在于:1) 数据层面:机器人操作轨迹、导航路径等数据采集成本高、格式各异、天然碎片化,且不同本体(如机械臂、机器狗)数据无法通用[7];2) 动作表示不统一:不同机器人采用不同的控制频率、坐标体系和动作表达方式,导致动作空间不兼容,模型难以迁移[7];3) 空间理解能力不足:缺乏稳定的三维语义建模能力,模型在复杂或长程任务中鲁棒性差[8];4) 导航能力高度碎片化:主流方法针对不同导航任务使用专用模型,难以形成统一能力框架[8] ABot-M0:统一具身操作底座 - ABot-M0是负责机器人“手”(操作)的基座模型,旨在让不同形态的机器人基于统一底座完成精细操作[4] - 核心解法是“动作语言统一”,通过统一坐标系、控制频率和增量式动作建模,将异构机器人的动作转换为统一表示[12][14] - 构建了时长超过9500小时、包含600多万条轨迹、涉及20多种具身形态的混合训练集,且完全基于公开数据,保证了路径的通用性[14] - 算法层面提出了AML(动作流形学习),在受物理规律约束的低维流形上学习,使生成的动作序列更高效、稳定[15] - 引入3D感知模块以增强对空间语义的理解,支持复杂环境下的精准操作决策[17] - 在Libero、Libero-Plus、RoboCasa等基准测试中达到SOTA,在Libero-Plus上的任务成功率达到80.5%,比此前最强方案提升近30%[20] ABot-N0:统一具身导航底座 - ABot-N0是负责机器人“腿”(导航)的基座模型,旨在让机器人在真实开放环境中执行长程复杂任务[4][22] - 采用“全任务一统”策略,在单一VLA架构内统一了五大核心导航任务:点位导航、目标物导航、指令跟随、POI导航、行人跟随[24][26] - 技术实现采用层次化的“大脑-动作”设计:认知大脑基于预训练LLM进行深度语义理解与任务拆解;动作专家利用流匹配技术生成精确、柔顺的轨迹[27][29] - 数据侧构建了约8000个高保真3D场景和近1700万条专家示例的导航数据引擎,依托高德多年积累的时空数据资产[30] - 在CityWalker、SocNav等七大权威基准测试中全面刷新纪录,其中SocNav成功率提升40.5%,HM3D-OVON物体导航成功率提升8.8%[32] - 通过Agentic Navigation System框架实现从指令理解到决策纠错的闭环,是全球首创的代理式导航系统,推动模型从实验室走向现实[33] 高德的竞争优势 - 数据资产护城河:超过20年的地图与位置服务积累,拥有大规模真实世界的3D场景理解能力、空间语义资产,这些是具身导航最稀缺且难以短期复制的训练资源[11][35][36] - 工程化落地能力:长期服务亿级用户的地图业务,要求系统稳定运行,此工程经验被迁移至具身系统,使可部署、可持续运行成为设计目标[35][37] - 数据治理与抽象能力:能够将地图数据资产脱敏转化为训练基础,并对600万条开源操作轨迹进行统一清洗与标准化,体现了深入的任务抽象与异构数据统一能力[36] 行业影响与未来展望 - 降低开发门槛与成本:统一数据格式和预训练权重,可能使中小团队过去需要6个月、数百万元成本的数据采集与训练,缩短到数周、数十万元的微调成本[38] - 改变开发范式:开发将从“重写整套感知-规划-控制系统”转向“基于底座模型做场景化微调”,一个小团队可能在几周内完成过去需要数十人、数月交付的项目[38] - 开启能力API化可能:未来机器人能力可能变成可组合的API,开发者可直接调用模型完成“整理书架”、“仓库盘点”等物理世界任务[38] - 尽管硬件成本、安全验证等问题仍存,但统一底座的出现标志着行业迈出了从定制工程走向通用底座的关键一步[38][39]

具身智能的「GPT时刻」?高德连发两个全面SOTA的ABot具身基座模型 - Reportify