特斯拉开源硬件,中国公司回应来了:直接把机器人大脑开源了
量子位·2026-04-22 16:00

文章核心观点 - 智平方公司通过发布“AlphaBrain Platform”开源社区,引领中国具身智能开源进入新阶段,其策略并非简单跟随特斯拉开源硬件,而是开源比硬件更值钱的全链路技术平台,旨在降低行业门槛、建立标准并汇聚生态力量 [1][2][9][112] 公司背景与市场定位 - 智平方成立于2023年,专注AGI原生的通用智能机器人,公司规模近300人 [5] - 公司因一年内完成12次融资,被称为全球具身智能领域融资节奏最快的独角兽,并被摩根士丹利列为具身基础模型的代表企业 [6] - 公司定位为行业稀缺的“生产力型”通用智能机器人玩家,专注于能真实交付、干活的机器人,而非表演或演示 [103] - 公司被资本和产业界标签为“最像特斯拉”的中国机器人公司,因其是人形机器人赛道首家引入端到端大模型技术路线的企业 [89][90][91] AlphaBrain Platform开源社区概述 - 该平台是全球首个一站式、开箱即用的具身智能模型开源社区,于4月22日发布 [2] - 开源内容并非单个模型,而是一套集成了前沿技术的“顶配全家桶”,包括最全架构覆盖、自由组合能力、公平评估标准和广泛开发社群 [4][7] - 平台旨在解决当前具身智能开源模型“多但不好用”的痛点,提供让模型“跑起来、比得清、落得地”的全链路能力,方便开发者复现、对比和场景化落地 [9] 核心技术亮点 - 世界模型:平台提供了全球首个可插拔世界模型架构(WA)[14] - 原生集成NVIDIA Cosmos Policy原始权重,开发者可直接加载其2B参数的DiT原始预训练权重进行动作预测 [15][16] - 预设三大主流世界模型Backbone供自由切换:Meta的V-JEPA 2.1(约18亿参数)、NVIDIA的Cosmos Predict系列(约21亿参数)、通义万相的Wan 2.2(约50亿参数)[18][21] - 通过一条命令即可切换训练模式,极大简化了操作 [24] - RL Token(强化学习+视觉语言动作模型组合):该方案旨在解决VLA结合强化学习时推理效率低和“灾难性遗忘”的难题 [26][27] - 通过信息瓶颈编码与VLA主体冻结,将需训练参数量从原本的3.9B骤降至约137M(仅占VLA总参数的3.5%)[29][30] - 在强化学习梯度更新环节仅涉及1.3M极轻量参数,使得开发者仅需单张消费级RTX 4090显卡即可跑通后训练 [31][32] - 实现了在不破坏模型原有能力前提下的低成本任务优化,让模型能够“稳定进化” [33][34] - 持续学习:平台系统化工程化了持续学习能力,使其从研究玩具变为多架构可复现的对比平台 [38][39] - 支持对QwenGR00T、NeuroVLA等多款前沿VLA架构进行横向对比 [40] - 实现了CL算法与业务模型的解耦,降低了算法研究者与模型开发者的协作成本 [42][45] - 提供开箱即用的训练-评估链路,LoRA路线下的检查点体积更小,对显存和存储更友好 [46][47] - 类脑模型(NeuroVLA):平台开源了全球首个支持在公开基准上验证的类脑具身开源模型NeuroVLA [51] - 采用脉冲神经网络动作头,模拟生物神经元的“放电”机制 [52][53] - 引入R-STDP训练算法,让机器人能从“成败”中学习,实现“用进废退” [56][58] - 具备在线STDP测试时自适应能力,可在零额外计算开销下实现实时学习 [60][61] - 配备GRU-FiLM动作精修模块,基于机器人本体状态对动作进行条件性修正,提升精度 [63] 平台价值与优势 - 降低门槛与促进落地:平台显著降低了开发与使用门槛,仅需消费级显卡即可运行,需训练参数量降至原本的3.5% [32][72] - 提供完整工具链:平台提供了从数据、训练、架构到测试、场景落地的完整工具链,支持低成本强化学习后训练微调,方便开发者快速适配自己的机器人 [71][73] - 建立统一标准:平台提供统一的Benchmark,支持开发者一键评测和对比不同模型的性能,无需自行搭建测试环境 [70] - 汇聚生态力量:平台旨在汇聚全球产学研的开源力量,加速行业共识形成 [7][77] 公司技术发展历程与成就 - 2024年6月,公司开源了首个VLA模型AlphaBrain初期版本,其规模仅为谷歌同类模型的1/20,但性能反超80%,该工作入选NeurIPS 2024并获得图灵奖得主Yann LeCun关注 [80][81][82] - 2025年7月,公司推出快慢系统深度融合的新一代VLA架构,性能超越国际标杆Pi0达30%,并以117.7 Hz的超高控制频率重新定义机器人控制 [82][84] - 公司早在2023年下半年便前瞻性提出世界模型应深度内生于VLA模型中,并于2025年11月在AlphaBrain中吸纳了Video2Act架构成果 [84][86] - 公司研发团队实力雄厚,拥有5位斯坦福全球前2%科学家,成员来自微软、谷歌、清华、北大等顶尖机构与企业 [101][102] - 创始人兼CEO郭彦东拥有深厚的学术与产业背景,曾主导数亿台智能终端的AI研发,2025年入选福布斯中国科创人物 [95][97][99] - 2025年,公司团队有数十篇论文被顶级会议收录,仅NeurIPS就达6篇,在世界模型、多模态理解与VLA方向持续获得国际认可 [100] 商业化进展与订单 - 公司打造的轮式通用智能机器人AlphaBot(爱宝)于2025年开始在工业场景规模化应用 [108] - 2025年9月,公司自建产线启用,并与全球前三的液晶面板厂商惠科签署了价值5亿元的大单,此为全球生产力型机器人最大的单一订单 [110] - 2025年12月,公司实现了单月百台级AlphaBot 2的真实交付,并规划在2026年将产线规模扩展至万台级别 [110] - 公司推出的模块化具身智能服务空间“智魔方”已在多地常态化运营,成为工业场景外的第二增量曲线 [109]

特斯拉开源硬件,中国公司回应来了:直接把机器人大脑开源了 - Reportify