Workflow
Aeon
icon
搜索文档
一个大脑控制所有机器人,真的可能吗?特斯拉、Skild AI、Agility 激辩人形机器人的量产路线|GTC 2026
AI科技大本营· 2026-03-18 15:52
行业现状与核心观点 - 人形机器人行业已迈过概念验证阶段,讨论焦点从“能否做出来”转向“如何量产并部署到现实世界” [3] - 行业面临的核心挑战不再是“让机器人动起来”,而是如何实现“稳定、可靠、持续地工作” [5][8] - 各公司技术路线存在显著分歧,包括对真实数据、仿真、模型架构和通用大脑的不同看法 [6][7] 各公司发展现状与部署进展 - **Agility Robotics**:其人形机器人Digit已部署在Amazon、GXO、Schaeffler等客户的物流和制造现场,承担大宗物料搬运工作,并与丰田达成合作 [14] - **特斯拉**:其自动驾驶软件已在美国部分地区运行无人监督车队,其人形机器人Optimus被视为其自动驾驶能力向具身智能的自然延伸 [17] - **Hexagon Robotics**:其首款多用途人形机器人Aeon于2025年6月发布,已与Schaeffler、飞机制造商Pilatus以及宝马展开试点合作 [23] - **Skild AI** 与 **Physical Intelligence**:均致力于开发可控制多种机器人形态的“通用大脑”模型 [22][23] 数据策略与来源 - **Agility Robotics**:采用混合数据策略,将数据分为金字塔结构,顶层是昂贵但贴近任务的真实远程操作数据,底层是量大但相关性较弱的视频数据,在客户现场受合规限制,顶层数据最难获取 [28][29][31] - **Physical Intelligence**:强调需要“大量真实机器人在真实世界里的数据”以覆盖未来真实场景,并发现当机器人数据足够多样时,模型能更好地利用人类视频数据 [37][40] - **特斯拉**:将其在自动驾驶中积累的数据管道方法论迁移至Optimus,关键在于筛选“有学习价值的数据”,而非数据总量,其车队一天可产出相当于500年驾驶经验的数据,但仅使用其中一小部分进行训练 [44][47][48] - **Hexagon Robotics**:不仅采集机器人动作数据,还利用其环境扫描技术记录完整的360度环境上下文,以区分任务关键信息与环境噪声 [58][61] - **Skild AI**:为解决数据稀缺的“鸡生蛋”困境,在预训练阶段大量使用人类视频和仿真数据来获取规模和多样性,再通过真实数据进行微调 [70][72][77] 仿真的角色与挑战 - **特斯拉**:针对不同目的使用不同类型的仿真器,强调仿真器必须在物理上足够准确,需要真实机器人数据不断将仿真“锚定在现实”以弥补仿真与现实间的差距 [82][84][86] - **Physical Intelligence**:较少使用仿真作为主要数据来源,但将其用于系统测试、策略评估和探索分布外环境 [88][89] - **Skild AI**:仿真在预训练阶段对于获取经验和规模至关重要,尤其在移动性任务上;但在涉及复杂资产的操作任务中,真实数据重要性上升 [96] - **Hexagon Robotics**:利用其高精度数字孪生构建“现实到仿真”的反馈闭环,以测量和缩小仿真与现实差距,并发现仿真能帮助工程师发现反直觉的解决方案 [109][111][119] 模型架构与“机器人大脑” - **Physical Intelligence**:采用分层架构,可将大任务分解为小步骤,使机器人能完成长达近15分钟的任务,并允许在更高抽象层进行监督和教学 [134][136] - **Skild AI**:其“具身大脑”模型内部存在自然分层,通过在预训练阶段让模型接触多种机器人形态的数据,使其获得了类似语言模型的上下文学习能力,能快速适应未见过的机器人身体 [142][145] - **特斯拉**:坚持端到端统一模型架构,输入视频,输出实时控制,认为高层与底层决策应内生于同一系统,以应对现实世界中的长尾问题 [151][153] - **Agility Robotics**:采用明确的分层架构(任务层、技能层、控制层),认为模块化设计对于实际部署至关重要,便于混合AI学习技能与工程化技能,并适应不同的计算和延迟约束 [122][163][167] - **Hexagon Robotics**:采用“最佳组合”路线,整合现有视觉语言模型和世界模型,并转向智能体编排思路,根据环境变化实时选择最合适的模型执行任务 [172][177] 向长时运行智能体的演进 - **Agility Robotics**:智能体能力将增强其已有的机器人编排平台,使其更智能,而非推翻现有系统 [182] - **特斯拉**:认为实现长时运行智能体的前提是机器人基础智能和安全性必须首先达到阈值 [184][186] - **Physical Intelligence**:长时运行为机器人提供了持续尝试和修正的机会,这可能成为提升可靠性并跨越实用门槛的关键 [188][190] - **Hexagon Robotics**:关注机器人舰队间的点对点经验共享,即一台机器人习得的新方法如何快速同步给整个舰队 [192] - **Skild AI**:指出机器人落地的“最后一公里”难度极大,应用场景的容错度将决定落地路径和节奏 [194][197]
卡帕西点赞特斯拉餐厅,马斯克:兄弟,你再回来吧
量子位· 2025-07-24 17:31
特斯拉餐厅开业 - 特斯拉在洛杉矶好莱坞开设首家餐厅Tesla Diner 主打汉堡、薯条等快餐 [9][11] - 餐厅配置包括两个13.7米大荧幕和80个汽车充电桩 结合餐饮与充电服务 [19] - 餐厅对公众开放 支持特斯拉车上点单 顾客反馈充电方便且节省等餐时间 [25][26] 擎天柱机器人表现 - 擎天柱在餐厅负责盛爆米花 每轮在岗6小时 但首日因WiFi连接问题出现故障 [28][29][33] - 马斯克计划2026年将擎天柱升级为送餐员 实现车边送餐服务 [41][42] - 当前擎天柱移动速度慢于人类 且项目负责人离职 发展面临挑战 [38][39] 行业竞争动态 - 工业巨头Hexagon推出Aeon人形机器人 由英伟达、微软等合作开发 定位工业领域应用 [46][47] - Aeon具备先进传感器和AI能力 可执行搬运、检测等任务 与擎天柱形成竞争 [47] 人才流动 - 原特斯拉AI负责人Karpathy曾从OpenAI被马斯克挖角 2022年离职后重返OpenAI [49][50][52] - 马斯克公开喊话希望Karpathy回归 显示对其能力的重视 [6][53]