通用大脑
搜索文档
一个大脑控制所有机器人,真的可能吗?特斯拉、Skild AI、Agility 激辩人形机器人的量产路线|GTC 2026
AI科技大本营· 2026-03-18 15:52
行业现状与核心观点 - 人形机器人行业已迈过概念验证阶段,讨论焦点从“能否做出来”转向“如何量产并部署到现实世界” [3] - 行业面临的核心挑战不再是“让机器人动起来”,而是如何实现“稳定、可靠、持续地工作” [5][8] - 各公司技术路线存在显著分歧,包括对真实数据、仿真、模型架构和通用大脑的不同看法 [6][7] 各公司发展现状与部署进展 - **Agility Robotics**:其人形机器人Digit已部署在Amazon、GXO、Schaeffler等客户的物流和制造现场,承担大宗物料搬运工作,并与丰田达成合作 [14] - **特斯拉**:其自动驾驶软件已在美国部分地区运行无人监督车队,其人形机器人Optimus被视为其自动驾驶能力向具身智能的自然延伸 [17] - **Hexagon Robotics**:其首款多用途人形机器人Aeon于2025年6月发布,已与Schaeffler、飞机制造商Pilatus以及宝马展开试点合作 [23] - **Skild AI** 与 **Physical Intelligence**:均致力于开发可控制多种机器人形态的“通用大脑”模型 [22][23] 数据策略与来源 - **Agility Robotics**:采用混合数据策略,将数据分为金字塔结构,顶层是昂贵但贴近任务的真实远程操作数据,底层是量大但相关性较弱的视频数据,在客户现场受合规限制,顶层数据最难获取 [28][29][31] - **Physical Intelligence**:强调需要“大量真实机器人在真实世界里的数据”以覆盖未来真实场景,并发现当机器人数据足够多样时,模型能更好地利用人类视频数据 [37][40] - **特斯拉**:将其在自动驾驶中积累的数据管道方法论迁移至Optimus,关键在于筛选“有学习价值的数据”,而非数据总量,其车队一天可产出相当于500年驾驶经验的数据,但仅使用其中一小部分进行训练 [44][47][48] - **Hexagon Robotics**:不仅采集机器人动作数据,还利用其环境扫描技术记录完整的360度环境上下文,以区分任务关键信息与环境噪声 [58][61] - **Skild AI**:为解决数据稀缺的“鸡生蛋”困境,在预训练阶段大量使用人类视频和仿真数据来获取规模和多样性,再通过真实数据进行微调 [70][72][77] 仿真的角色与挑战 - **特斯拉**:针对不同目的使用不同类型的仿真器,强调仿真器必须在物理上足够准确,需要真实机器人数据不断将仿真“锚定在现实”以弥补仿真与现实间的差距 [82][84][86] - **Physical Intelligence**:较少使用仿真作为主要数据来源,但将其用于系统测试、策略评估和探索分布外环境 [88][89] - **Skild AI**:仿真在预训练阶段对于获取经验和规模至关重要,尤其在移动性任务上;但在涉及复杂资产的操作任务中,真实数据重要性上升 [96] - **Hexagon Robotics**:利用其高精度数字孪生构建“现实到仿真”的反馈闭环,以测量和缩小仿真与现实差距,并发现仿真能帮助工程师发现反直觉的解决方案 [109][111][119] 模型架构与“机器人大脑” - **Physical Intelligence**:采用分层架构,可将大任务分解为小步骤,使机器人能完成长达近15分钟的任务,并允许在更高抽象层进行监督和教学 [134][136] - **Skild AI**:其“具身大脑”模型内部存在自然分层,通过在预训练阶段让模型接触多种机器人形态的数据,使其获得了类似语言模型的上下文学习能力,能快速适应未见过的机器人身体 [142][145] - **特斯拉**:坚持端到端统一模型架构,输入视频,输出实时控制,认为高层与底层决策应内生于同一系统,以应对现实世界中的长尾问题 [151][153] - **Agility Robotics**:采用明确的分层架构(任务层、技能层、控制层),认为模块化设计对于实际部署至关重要,便于混合AI学习技能与工程化技能,并适应不同的计算和延迟约束 [122][163][167] - **Hexagon Robotics**:采用“最佳组合”路线,整合现有视觉语言模型和世界模型,并转向智能体编排思路,根据环境变化实时选择最合适的模型执行任务 [172][177] 向长时运行智能体的演进 - **Agility Robotics**:智能体能力将增强其已有的机器人编排平台,使其更智能,而非推翻现有系统 [182] - **特斯拉**:认为实现长时运行智能体的前提是机器人基础智能和安全性必须首先达到阈值 [184][186] - **Physical Intelligence**:长时运行为机器人提供了持续尝试和修正的机会,这可能成为提升可靠性并跨越实用门槛的关键 [188][190] - **Hexagon Robotics**:关注机器人舰队间的点对点经验共享,即一台机器人习得的新方法如何快速同步给整个舰队 [192] - **Skild AI**:指出机器人落地的“最后一公里”难度极大,应用场景的容错度将决定落地路径和节奏 [194][197]
2年估值破100亿,千寻智能却不敢松口气
搜狐财经· 2026-02-27 16:08
行业与市场动态 - 人形机器人“百亿俱乐部”在2026年春节前后迅速扩容 新晋成员包括星海图、智平方与千寻智能 行业估值标杆已形成板块效应[3] - 2026年人形机器人赛道融资性质发生根本变化 从发展“加速器”转变为竞争“门票” 若无法获得充足资金将失去竞争资格[4] - 行业融资热度出现结构性转向 2025年第三季度赛道融资额同比下降42% 融资事件数量减少35% 市场正从“押概念”转向“看兑现”[26] - 行业正从概念和表演阶段走向工业验证阶段 资本更愿意为机器人“进厂打工”的实际能力下注[27] 公司融资与估值 - 千寻智能于2月24日宣布连续完成两轮融资近20亿元 公司估值突破百亿元[2] - 融资方阵容呈现“新老同押”特点 新股东包括云锋基金、红杉中国、TCL创投、360基金等 老股东顺为资本、Prosperity7、达晨财智等持续加注[3] - 公司自2024年1月成立至估值破百亿仅用时26个月 累计完成6轮融资 总额约33.28亿元 融资节奏极快[7][8] - 公司融资曲线为“技术驱动型” 每次模型性能跃迁都对应一次估值抬升[15] 公司技术与产品 - 公司技术路线押注“大模型+具身”融合路径 将人形机器人的最大机会定位为“大脑”[12][13] - 2025年3月发布Spirit V1 VLA模型 使机器人能完成“叠衣服”等长程复杂任务[14] - 2026年1月开源的Spirit v1.5模型在RoboChallenge的Table30榜单中以66.09分、50.33%的成功率超越Pi0.5 成为首个在公开基准测试中性能超过Pi0.5的中国开源具身模型[14] - 公司将80%的资源押注在数据体系建设上 目标是冲击具身大脑全球Top 3 并将有效训练数据规模从行业较好的1万小时提升至100万小时[16][17] - 数据获取采用工业化、成本可控的方法 借助互联网视频预训练及多路并行采集线下数据 据披露成本相比传统做法降低约90% 且保留“脏数据”以提升模型泛化能力[19] 公司商业化与落地 - 公司商业化路径务实 优先选择工业场景而非家庭场景 因工业场景任务明确、标准清晰、可量化验证[23] - 2025年12月 公司Moz机器人进入宁德时代中州基地的新能源动力电池生产线 承担电池插拔检测任务 从公司成立到进入工业规模化场景仅用22个月[25] - 在宁德时代产线上 公司已参与生产超过1000块电池 实现了在产线上稳定工作的能力[25] - 公司创始人提出明确的中期目标:在大厂全面进入前 将自己发展为“中厂” 实现一年至少卖出10万台机器人[26] 公司团队与创始人背景 - 创始人韩峰涛为机器人行业二次创业者 曾联合创立协作机器人公司珞石并担任CTO 带领团队交付超2万台工业机器人[9] - 创始人基于过去十年行业观察 指出工业机器人国产化率从3%提升至超50% 但行业普遍盈利困难 核心问题在于机器人泛化能力弱[10] - 2023年ChatGPT出现后 创始人意识到通用AI是变量 并找到清华大学视觉与人形机器人实验室主任高阳共同创业 团队配置被投资人评价为对标Pi、Google DeepMind梯队[11][12][13] 行业竞争与挑战 - 创始人判断 未来真正的竞争对手将是华为、小米、理想等软硬件一体化的科技大公司[26] - 尽管获得高额融资 但窗口期正在急速收窄 资本和技术的双重压力叠加 一旦掉队则翻盘可能性微乎其微[16] - “All in 数据”的战略押注风险巨大 一旦数据规模拉满而性能未线性提升 资本耐心将迅速消耗[21][22]
太狠了,四条腿被锯掉也能爬,通用大脑开启机器人「无休」时代
36氪· 2025-10-17 20:47
核心技术突破 - 提出名为Skild Brain的通用机器人大脑概念,其核心是与机器人身体解耦,可独立适应[3][4] - 控制策略分为高频与低频两个层级,高层负责规划导航,低层负责将策略转化为关节扭矩和角度,并能在不同机器人之间迁移[6] - 系统通过大规模模拟训练实现能力,构建包含1万种不同机器人形态的虚拟宇宙,模型在其中进行了相当于1000年的模拟时间训练[13] 核心能力与特点 - 具备强大的在线自适应机制,能实时感知身体状态(如腿僵住、电机卡住)并立刻调整控制策略[14] - 拥有非凡的长时记忆力,其上下文窗口比多数机器人控制策略长一百倍以上,能记住过去更长时间的反馈和动作轨迹[17] - 展现出“零样本”适应能力,能在训练集中未包含的极端损伤场景(如断肢、关节锁死)下快速找到可行的行动方式[8][9] 技术实现路径 - 融合强化学习路径,模型在模拟世界中不断尝试、失败、优化,并结合长时记忆实现快速修正[13] - 具备迁移与泛化能力,旨在实现“一次学习,处处可用”,可跨不同机器人形态和任务操作[13] - 通过将硬件故障从致命伤转变为可“绕道继续”的挑战,实现了机器人控制范式的一次跃迁[6][12] 应用场景与潜力 - 在工业领域可大幅提升效率,生产线上的机器人不必因小故障就全线停机,能带伤工作至维护窗口[21][22] - 在灾难救援中价值直观,即使机器人“残肢断臂”也能在恶劣条件下继续执行搜救任务[23][24][25] - 潜在应用于军事领域,提升设备在战损后的续航力与生存力,以及在消费级市场实现一个大脑多用途以摊薄成本[26][27]