核心观点 - 智源研究院推出全球首个具身智能SaaS开源框架RoboOS 2 0和通用具身大脑RoboBrain 2 0 实现感知、推理与规划一体化 [1][3] - 32B版本在多项权威基准测试中刷新纪录 空间推理能力超越Gemini、GPT-4o等主流模型 [2][21][23] - 开源框架RoboOS 2 0采用MCP协议与无服务器架构 端到端性能提升30% 响应时延低于3ms [3][27][29] 技术架构 RoboBrain 2 0 - 突破三大瓶颈:空间理解精度不足、时间依赖建模薄弱、长链推理能力欠缺 支持高精度物体定位、多步任务规划和因果逻辑提取 [5][10] - 采用模块化编码器-解码器架构 处理多模态输入(图像、视频、语言指令) 实现感知-推理-规划统一 [7][8] - 三阶段训练流程:基础时空学习(4 8M样本)、具身时空增强(224K样本)、具身情境推理链训练(195K样本) [13][14][16][18] RoboOS 2 0 - 首创SaaS模式 支持无服务器部署 代码量仅为传统方式的1/10 [27][28] - 三大组件:云端大脑模型、分布式小脑模块群、实时共享内存机制 新增场景图共享和任务监控模块 [28][29] - 多机协作四阶段:任务分解、动态分配、并行执行、状态更新 通信效率提升27倍 [30][29] 性能表现 - 空间推理:BLINK(83 95)、CV-Bench(85 75)等9项测试SOTA 超越基线模型5-15个百分点 [21] - 时间推理:多机器人规划(80 33)、Ego-Plan2(57 23)领先Qwen2 5-VL和Claude [23][24] - 提供7B轻量化版本 适配边缘设备 在低资源环境下性能仍超主流开闭源模型 [24] 应用生态 - 支持商超/厨房/居家多场景部署 实现多智能体协作任务执行 [25] - 配套推出RoboSkill技能商店和开箱即用镜像 支持三行指令极速部署 [32] - 模型权重、训练代码、评测基准全面开源 覆盖7B/32B版本及多芯片镜像 [33][34]
具身智能大脑+首个SaaS开源框架,智源研究院刷新10项测评基准,加速群体智能新范式
量子位·2025-07-14 13:23