蚂蚁灵波一周“四连发”,“卷”向具身智能基座开源
第一财经·2026-01-30 20:07

蚂蚁集团灵波科技开源具身智能模型系列 - 蚂蚁集团旗下具身智能公司灵波科技在一周内接连开源四个大模型,包括LingBot-VA、LingBot-Depth、LingBot-VLA和LingBot-World [1] - 此举与阿里云在大模型领域的开源策略类似,旨在通过开源建立公司在具身智能领域的行业影响力 [4] - 公司成立时旨在打造领先的机器人产品,如今其战略野心已扩展至具身智能的基座领域 [4] 开源模型的技术细节与功能 - LingBot-VA:提出自回归视频-动作世界建模框架,将大规模视频生成模型与机器人控制深度融合,使机器人能“边推演、边行动” [1] - LingBot-Depth:与奥比中光合作,攻克机器人视觉难题,使其能精准抓取透明反光物,更清晰地“看清楚”物理世界 [2] - LingBot-VLA:是蚂蚁开源的第一款具身智能基座模型,实现了跨本体、跨任务的泛化能力,推动“一脑多机”走向可规模化落地 [2] - LingBot-World:为具身智能、自动驾驶及游戏开发等场景创造高保真、可交互的虚拟训练环境,在多项关键指标上可对标Google Genie 3 [2] 开源策略的行业影响与目标 - 除了模型权重,蚂蚁在LingBot-VLA的开源中还同步开放了包含数据处理、高效微调及自动化评估在内的全套代码库 [4] - 此举旨在降低开发者的模型训练周期和成本,降低商业化落地的算力与时间门槛 [4] - 公司认为高效的具身基座模型是具身智能大规模应用的关键,期待加速技术迭代与规模化应用,助力AGI(通用人工智能)更快到来 [4] 行业现状与未来竞争格局 - 具身智能技术仍在经历从实验室走向千行百业的难关 [1][4] - 蚂蚁等大型科技公司的AGI战略向物理世界延伸,或将加速这一进程 [4] - 未来具身智能的产业竞争将从“技术卡位”进一步蔓延至全栈能力与生态协同的建设之中 [4]