阿里这次出招具身智能,剑指深度环境理解力
华尔街见闻·2026-02-10 16:31

阿里巴巴达摩院发布具身智能大脑模型 - 阿里巴巴达摩院正式发布具身智能大脑基础模型RynnBrain,并一次性开源了包括业界首个30B MoE(混合专家模型)架构在内的7个全系列模型 [2] - RynnBrain首次让机器人拥有了时空记忆和空间推理能力,在16项具身开源评测榜单上刷新纪录,超越谷歌Gemini Robotics ER 1.5等行业顶尖模型 [2] - 此举旨在打破具身智能长期存在的“智力高墙”,解决“时空遗忘”与“物理幻觉”问题,使机器人大脑从简单指令接收器进化为具备深度环境理解能力的智能实体 [2] 模型的核心技术创新 - RynnBrain创造性地引入了时空记忆和物理世界推理两项核心能力,这是机器人与环境深度互动所需的基本能力 [5] - 时空记忆能力使机器人能够在完整历史记忆中定位物体、回溯目标区域、预测运动轨迹,赋予全局时空回溯能力,解决了长期存在的“瞬时失忆”难题 [6] - 物理空间推理采用文本与空间定位交错进行的策略,确保推理过程紧密扎根于物理环境,大大减弱了幻觉问题 [6] - 模型在Qwen3-VL基础上训练,采用自研RynnScale架构进行深度优化,在同等算力下实现两倍的训练加速,训练数据量超过2000万对 [6] 模型性能与开源策略 - RynnBrain在环境感知、对象推理、第一人称视觉问答、空间推理、轨迹预测等16项关键任务中全方位刷新行业纪录 [6] - 模型拥有良好的可拓展性,能够快速后训练出导航、规划、动作等多种具身模型,有望成为具身行业的基础模型 [7] - 达摩院开源了RynnBrain全系列7个模型,包含全尺寸基础模型与后训练专有模型,其中包含业界首个MoE架构的30B具身模型 [8] - 开源的30B MoE模型只需要3B的推理激活参数就能超越业界72B模型效果,能让机器人动作更快、更丝滑 [8] - 达摩院同时开源了用于评测时空细粒度具身任务的全新评测基准RynnBrain-Bench,填补了行业空白 [9] 行业背景与公司战略 - 具身模型的智能水平是制约机器人走向通用化的重要瓶颈,尤其是泛化能力的短板极大地限制了其在复杂物理场景中的应用 [2] - 行业技术探索面临挑战:侧重于动作输出的VLA模型因高质量机器数据稀缺而极难实现跨场景泛化;引入VLM等大脑模型则普遍缺乏记忆能力,动态认知受限且存在物理幻觉 [3] - 阿里巴巴达摩院此举旨在加速构建一个开放、可进化的具身智能生态 [10] - 达摩院具身智能实验室负责人指出,RynnBrain首次实现了大脑对物理世界的深度理解与可靠规划,为通用具身智能迈出关键一步,期待加速AI从数字世界走向真实物理场景的落地进程 [11] - 在阿里集团组织变革背景下,达摩院研究领域聚焦于“智能+计算”,智能方向包含具身智能,该领域是达摩院如今重点投入的方向之一 [11][12] - 达摩院在具身智能领域已构建了包括WorldVLA、RynnEC等模型及RynnRCP协议在内的系统 [12] 全球市场与行业影响 - 全球人形机器人市场在2025年迎来规模化起点 [13] - IDC数据显示,去年全年全球人形机器人出货量接近1.8万台,同比增长约508%,销售额约4.4亿美元;同期累计销售订单量预计超过3.5万台 [14] - RynnBrain的开源为全球开发者提供了一套相对成熟的“大脑模板”,有助于解决真实物理反馈数据稀缺、非结构化环境泛化等挑战,加速具身智能产业化落地 [14] - 此次开源被视为一次技术权力的重新分配,当顶尖模型不再局限于巨头实验室,具身智能产业将进入一个加速迭代、群体进化的新周期 [14]

阿里这次出招具身智能,剑指深度环境理解力 - Reportify