Workflow
原子万象
icon
搜索文档
快慢双系统成为具身智能主流技术路线?10家企业的差异、特性都在哪?
机器人大讲堂· 2025-10-02 08:34
机器人快慢双系统架构核心观点 - 机器人领域借鉴人类认知的"双系统理论",采用快慢双系统架构以解决高频精准控制与复杂高层任务规划难以在单一系统中兼顾的核心矛盾[1] - 快慢系统解耦实现独立升级AI算法而不改动底层稳定控制框架,降低系统开发复杂性[1] - 该架构将长链条端到端模型拆分为视觉语言模型和动作执行两个模型,实现功能解耦与真异步并行,避免机器人因思考而卡顿[4] - 机器人快慢双系统架构已成为实现高级别机器人智能的主流范式,但在具体实现上呈现百花齐放局面[5] 代表性企业技术方案 - **Figure AI Helix**:采用系统1(快思考)和系统2(慢思考)双系统架构,系统1为8000万参数Transformer模型以200Hz频率执行闭环控制,系统2为70亿参数预训练视觉语言模型以7-9 Hz频率传递潜在向量[6][7] - **PI Hi Robot**:分层交互式机器人学习系统通过协同训练技术融合多机器人知识源,慢系统视觉语言模型理解复杂指令全局意图并分解子步骤,生成可解读中间指令[9][10] - **智平方 GOVLA**:由空间交互基础模型、慢系统和快系统组成,慢系统基于大规模参数视觉语言模型负责高层次语义理解,快系统实时生成可执行动作,首次实现机器人全身协同控制和移动轨迹端到端输出[12][13] - **星海图 G0**:构建全球首个开放场景高质量真机数据集涵盖500小时时长、150个任务、50个场景,采用三阶段渐进式课程学习策略,仅需不到100条特定任务演示数据即可快速掌握复杂新技能[15][16] - **擎朗智能 KOM2.0**:慢系统基于视觉语言模型通过K-Infinity数据集实现服务场景环境感知,快系统采用动作专家模型利用大量真机数据训练,开创性提出岗位化垂域模型KEENON ProS实现快速落地[18][19] - **星动纪元 ERA-42**:采用高层次规划与低层次控制双系统架构,慢思考世界模型使用70亿参数视觉语言模型进行任务预演生成未来动作预测,快思考高频执行系统使用4000万参数Transformer模型实现抗干扰能力[21][22] - **节卡 JAKA EVO**:慢系统实现快速任务解析与规划,通过轻量模仿学习机制在交付后能通过少量示教快速迁移适配新场景,打破传统机器人需要数周调试困境[25][26] - **微亿智造**:通过云、边、端三层技术架构实现快慢思考,基于超过15TB、包含超过10亿条精标数据点的真实工业场景数据库,实现开箱即用[28] - **魔法原子 原子万象**:快系统基于高效动作专家模型处理毫秒级实时控制,慢系统由参数规模更大
5.28亿融资砸向杭州具身智能公司,清华叉院机器人天才坐镇,被称为“中国版Figure”
量子位· 2025-03-31 12:35
公司融资动态 - 千寻智能完成5.28亿元Pre-A轮融资,为第四轮融资[1][2] - 此前种子轮+天使轮融资2亿元[3] - 本轮融资由Prosperity7 Ventures领投,招商局创投、广发信德等多家资本参与,老股东达晨财智等持续加码[3][4] 技术进展 - AI方面发布自研VLA Spirit v1抢先版,攻克柔性物体长程操作难题[9][10][13] - 机器人方面预告首款商用级人形机器人Moz1,拥有26个自由度,功率密度比特斯拉Optimus高15%[15][18][19] 公司背景 - 成立于2024年2月,总部杭州,聚焦智能制造、物流、康养领域,计划2025年交付数百台产品[21][22] - 团队来自UC伯克利、CMU、清华、北大及字节、小米等企业[24] - 创始人韩峰涛为机器人行业连续创业者,联合创始人高阳为清华助理教授,其ViLa算法被Figure采用[25][26] 行业趋势 - 3月具身智能领域融资活跃:智元机器人获腾讯投资,估值150亿元;原力灵机获2亿元天使轮;它石智能获1.2亿美元天使轮[33][35][37][38] - 高盛预测2035年全球人形机器人市场规模达1540亿美元[47] - 行业共识认为具身智能的突破将是长期累积过程,而非瞬间爆发[49][50] 技术发展方向 - 中国具身智能大会提出15大重点方向,包括多模态感知、具身大模型、人机协同等[45]