AlphaBrain Platform
搜索文档
腾讯研究院AI速递 20260423
腾讯研究院· 2026-04-23 00:21
生成式AI - OpenAI发布ChatGPT Images 2.0,支持复杂视觉任务和高密度文本渲染,最高支持2K分辨率,宽高比可在3:1至1:3间灵活调整 [1] - ChatGPT Images 2.0模型首次引入“思考能力”,可联网获取实时信息,单次提示最多生成8张角色与元素保持一致的图像 [1] - 模型多语言渲染能力显著增强,中日韩印地孟加拉语文本表现突出,已向ChatGPT、Codex与API全量用户开放 [1] - Anthropic推出STEM Fellow项目,招募各学科专家驻场旧金山三个月,每周提供3800美元津贴,机器学习经验非必需 [2] - 该项目核心是让科学家用专业判断力校准Claude“自信但错误”的输出,以弥补模型在长周期科研任务中的能力短板 [2] - 这是三代Fellowship的深化,标志着AI竞争从算力比拼转向行业专家资源的争夺 [2] - 谷歌发布Deep Research和Deep Research Max两款自主研究智能体,基于Gemini 3.1 Pro构建,通过Gemini API付费套餐开放预览 [3] - 智能体新增MCP协议支持,可安全连接企业私有数据库与第三方数据源,已与FactSet、标普、PitchBook等金融数据商达成合作 [3] - 报告中可原生生成图表和信息图,支持多模态输入与协作式规划,向企业级研究分析基础设施方向演进 [3] - Anthropic对约2%新专业用户测试更贵订阅方案,部分Pro(每月20美元)用户的Claude Code使用权被取消,新增实名验证引发不满 [4] - OpenAI趁机对用户开放Codex测试,免费与付费套餐均可使用,其负责人发文直接对标Claude Code [4] - Codex近期新增Computer Use、内置浏览器、Chronicle屏幕记忆与90多项插件,目标从代码工具演变为全能桌面助手 [4] - 商汤绝影发布端侧多模态智能体基座大模型Sage,采用MoE架构,总参数320亿、激活参数仅30亿,已在英伟达Orin X平台部署 [6] - 在PinchBench评测中,Sage模型最佳任务完成率达94%,超越Claude Opus 4.6(93.3%)、GPT-5.4(90.5%)等云端旗舰模型 [6] - 依托自研SCOUT分级协同学习与ERL可擦除强化学习技术,Sage模型训练算力节省60%、复杂任务完成率提升20% [6] 行业并购与资本动态 - 马斯克旗下SpaceX宣布拟以600亿美元收购AI编程工具Cursor,较去年11月估值翻倍,亦可选择以100亿美元建立合作关系 [5] - 此前SpaceX以1.25万亿美元并购xAI,但Grok追赶OpenAI与Anthropic效果不佳,收购旨在借Cursor工程师生态补齐短板 [5] - SpaceX筹备6月IPO目标估值1.5万亿美元,Cursor或可接入百万H100当量的Colossus超算以提升模型训练能力 [5] - 《福布斯》发布第八届AI 50榜单,OpenAI与Anthropic累计融资2426亿美元,占上榜企业总融资额3056亿美元的约80% [8] - 榜单中有20家新面孔入围,包括开源模型公司Reflection(估值80亿美元)、AI演示工具Gamma、AI药物研发Chai Discovery等 [8] - 四家女性创始企业上榜,包含穆拉蒂的Thinking Machine Labs与李飞飞的World Labs,并首次推出AI 50 Brink早期榜单 [8] 前沿科技与开源生态 - 智平方联合港科大(广州)发布AlphaBrain Platform,这是全球首个一站式具身智能模型开源社区,打通数据、训练、模型与评测全链路 [7] - 该平台一次性开源三大“全球首创”:类脑VLA模型NeuroVLA、基于RL Token的VLA训练架构、可插拔世界模型架构WA [7] - 其RL后训练参数从39亿压缩至1.37亿,单张4090显卡即可微调,覆盖LIBERO等8大主流Benchmark,显著降低研究门槛 [7]
特斯拉开源硬件,中国公司回应来了:直接把机器人大脑开源了
量子位· 2026-04-22 16:00
文章核心观点 - 智平方公司通过发布“AlphaBrain Platform”开源社区,引领中国具身智能开源进入新阶段,其策略并非简单跟随特斯拉开源硬件,而是开源比硬件更值钱的全链路技术平台,旨在降低行业门槛、建立标准并汇聚生态力量 [1][2][9][112] 公司背景与市场定位 - 智平方成立于2023年,专注AGI原生的通用智能机器人,公司规模近300人 [5] - 公司因一年内完成12次融资,被称为全球具身智能领域融资节奏最快的独角兽,并被摩根士丹利列为具身基础模型的代表企业 [6] - 公司定位为行业稀缺的“生产力型”通用智能机器人玩家,专注于能真实交付、干活的机器人,而非表演或演示 [103] - 公司被资本和产业界标签为“最像特斯拉”的中国机器人公司,因其是人形机器人赛道首家引入端到端大模型技术路线的企业 [89][90][91] AlphaBrain Platform开源社区概述 - 该平台是全球首个一站式、开箱即用的具身智能模型开源社区,于4月22日发布 [2] - 开源内容并非单个模型,而是一套集成了前沿技术的“顶配全家桶”,包括最全架构覆盖、自由组合能力、公平评估标准和广泛开发社群 [4][7] - 平台旨在解决当前具身智能开源模型“多但不好用”的痛点,提供让模型“跑起来、比得清、落得地”的全链路能力,方便开发者复现、对比和场景化落地 [9] 核心技术亮点 - **世界模型**:平台提供了全球首个可插拔世界模型架构(WA)[14] - 原生集成NVIDIA Cosmos Policy原始权重,开发者可直接加载其2B参数的DiT原始预训练权重进行动作预测 [15][16] - 预设三大主流世界模型Backbone供自由切换:Meta的V-JEPA 2.1(约18亿参数)、NVIDIA的Cosmos Predict系列(约21亿参数)、通义万相的Wan 2.2(约50亿参数)[18][21] - 通过一条命令即可切换训练模式,极大简化了操作 [24] - **RL Token(强化学习+视觉语言动作模型组合)**:该方案旨在解决VLA结合强化学习时推理效率低和“灾难性遗忘”的难题 [26][27] - 通过信息瓶颈编码与VLA主体冻结,将需训练参数量从原本的3.9B骤降至约137M(仅占VLA总参数的3.5%)[29][30] - 在强化学习梯度更新环节仅涉及1.3M极轻量参数,使得开发者仅需单张消费级RTX 4090显卡即可跑通后训练 [31][32] - 实现了在不破坏模型原有能力前提下的低成本任务优化,让模型能够“稳定进化” [33][34] - **持续学习**:平台系统化工程化了持续学习能力,使其从研究玩具变为多架构可复现的对比平台 [38][39] - 支持对QwenGR00T、NeuroVLA等多款前沿VLA架构进行横向对比 [40] - 实现了CL算法与业务模型的解耦,降低了算法研究者与模型开发者的协作成本 [42][45] - 提供开箱即用的训练-评估链路,LoRA路线下的检查点体积更小,对显存和存储更友好 [46][47] - **类脑模型(NeuroVLA)**:平台开源了全球首个支持在公开基准上验证的类脑具身开源模型NeuroVLA [51] - 采用脉冲神经网络动作头,模拟生物神经元的“放电”机制 [52][53] - 引入R-STDP训练算法,让机器人能从“成败”中学习,实现“用进废退” [56][58] - 具备在线STDP测试时自适应能力,可在零额外计算开销下实现实时学习 [60][61] - 配备GRU-FiLM动作精修模块,基于机器人本体状态对动作进行条件性修正,提升精度 [63] 平台价值与优势 - **降低门槛与促进落地**:平台显著降低了开发与使用门槛,仅需消费级显卡即可运行,需训练参数量降至原本的3.5% [32][72] - **提供完整工具链**:平台提供了从数据、训练、架构到测试、场景落地的完整工具链,支持低成本强化学习后训练微调,方便开发者快速适配自己的机器人 [71][73] - **建立统一标准**:平台提供统一的Benchmark,支持开发者一键评测和对比不同模型的性能,无需自行搭建测试环境 [70] - **汇聚生态力量**:平台旨在汇聚全球产学研的开源力量,加速行业共识形成 [7][77] 公司技术发展历程与成就 - 2024年6月,公司开源了首个VLA模型AlphaBrain初期版本,其规模仅为谷歌同类模型的1/20,但性能反超80%,该工作入选NeurIPS 2024并获得图灵奖得主Yann LeCun关注 [80][81][82] - 2025年7月,公司推出快慢系统深度融合的新一代VLA架构,性能超越国际标杆Pi0达30%,并以117.7 Hz的超高控制频率重新定义机器人控制 [82][84] - 公司早在2023年下半年便前瞻性提出世界模型应深度内生于VLA模型中,并于2025年11月在AlphaBrain中吸纳了Video2Act架构成果 [84][86] - 公司研发团队实力雄厚,拥有5位斯坦福全球前2%科学家,成员来自微软、谷歌、清华、北大等顶尖机构与企业 [101][102] - 创始人兼CEO郭彦东拥有深厚的学术与产业背景,曾主导数亿台智能终端的AI研发,2025年入选福布斯中国科创人物 [95][97][99] - 2025年,公司团队有数十篇论文被顶级会议收录,仅NeurIPS就达6篇,在世界模型、多模态理解与VLA方向持续获得国际认可 [100] 商业化进展与订单 - 公司打造的轮式通用智能机器人AlphaBot(爱宝)于2025年开始在工业场景规模化应用 [108] - 2025年9月,公司自建产线启用,并与全球前三的液晶面板厂商惠科签署了价值5亿元的大单,此为全球生产力型机器人最大的单一订单 [110] - 2025年12月,公司实现了单月百台级AlphaBot 2的真实交付,并规划在2026年将产线规模扩展至万台级别 [110] - 公司推出的模块化具身智能服务空间“智魔方”已在多地常态化运营,成为工业场景外的第二增量曲线 [109]