Workflow
Spirit v1.5 VLA模型
icon
搜索文档
登顶全球第一后,这家中国公司把“具身大脑”开源了!
华尔街见闻· 2026-01-12 18:32
文章核心观点 - 中国创业公司千寻智能自研的Spirit v1.5 VLA模型在RoboChallenge真机评测中以总分66.09、成功率50.33%的成绩超越美国Physical Intelligence等对手,拿下全球第一,标志着具身智能行业竞争从硬件比拼进入比拼“大脑”的下半场 [1][2][6] - 千寻智能在登顶后随即开源了Spirit v1.5的基模权重、推理代码及使用样例,其战略意图在于抢占具身智能“通用大脑”的生态位,并有望通过成为行业基础(Baseline)而转型为平台型公司 [3][20][24][25] - 公司通过创新的技术路径(如VLA统一架构、独特数据飞轮)和真实的工业落地案例(宁德时代产线),证明了其模型在处理复杂、非标任务上的高效与稳定,从而推动行业估值逻辑从“硬件叙事”转向“模型叙事” [10][15][19][31] 行业现状与痛点 - 具身智能行业存在“虚火”,演示(Demo)动作在预设环境下流畅,但在真实混乱场景中往往错漏百出,陷入“四肢发达,头脑简单”的困境 [4][5] - 行业长期依赖在高度受控环境下采集的“干净数据”进行训练,导致模型过拟合,缺乏在真实物理世界中的泛化能力 [8][9] - 行业存在“重复造轮子”的痛点,每家机器人公司都试图从零训练自己的基础模型,造成资源浪费且水平参差不齐 [23] 千寻智能的技术突破 - Spirit v1.5采用了创新的VLA(Vision-Language-Action)统一架构,实现端到端的“直觉反应”,让机器人感知即行动,不同于传统的拼凑式模块 [10] - 公司构建了“先离散,后连续”的独特数据飞轮,并在物理世界验证了大模型Scaling Law的有效性 [11] - 模型训练数据源拥抱混乱,第一阶段预训练使用了海量、杂乱的互联网视频(如YouTube、爱奇艺)以学习物理世界的多样性,第二阶段才引入真实遥操作数据进行微调 [17] 商业化落地与成效 - 2025年底,千寻智能的人形机器人“小墨”已批量部署于宁德时代中州基地的电池PACK产线,这是全球首条人形机器人电池PACK产线 [15][16] - 在宁德时代的产线中,机器人处理高压、高精度的电池插接等“非标”场景,连续运行中插接成功率稳定在99%以上,单日工作量实现了3倍提升 [18][19] - 这一案例证明,在Spirit大模型加持下,机器人能够处理复杂工业任务,并在效率和良率上超越人类熟练工,使人形机器人从“展示品”变为实用工具 [18][19] 开源战略与行业影响 - 千寻智能通过开源Spirit v1.5,直接拉高了行业的“标准线”,旨在使其成为学界和产业界研究的基础(Baseline) [24] - 此举旨在抢占具身智能“通用大脑”的生态位,目标是使千寻智能转型为一家“赋能全球机器人公司”的平台型公司 [20][25] - 公司战略类似OpenAI,当模型能力形成真正的代际差时,仍握有转向闭源的主动权 [26] 行业范式转变 - 具身智能的竞争正从比拼硬件的“上半场”,迈入比拼大脑的“下半场” [6][30] - 行业正从“Demo时代”迈进需要拥抱混乱的“实战时代” [7] - 对于投资者,公司的估值逻辑正在重构,从对标发那科(Fanuc)的硬件制造商,转向对标OpenAI的AI平台公司 [31] - Spirit v1.5展现出的“一脑多形”能力,意味着其商业天花板不再受限于硬件产能,而取决于模型的泛化边界 [31] - 行业的真正壁垒,正在从硬件转向数据、模型、生态、标准 [32]