Spirit v1.5 VLA模型 - 财报，业绩电话会，研报，新闻

Spirit v1.5 VLA模型

搜索文档

华尔街见闻· 2026-01-12 18:32

文章核心观点 - 中国创业公司千寻智能自研的Spirit v1.5 VLA模型在RoboChallenge真机评测中以总分66.09、成功率50.33%的成绩超越美国Physical Intelligence等对手，拿下全球第一，标志着具身智能行业竞争从硬件比拼进入比拼“大脑”的下半场 [1][2][6] - 千寻智能在登顶后随即开源了Spirit v1.5的基模权重、推理代码及使用样例，其战略意图在于抢占具身智能“通用大脑”的生态位，并有望通过成为行业基础（Baseline）而转型为平台型公司 [3][20][24][25] - 公司通过创新的技术路径（如VLA统一架构、独特数据飞轮）和真实的工业落地案例（宁德时代产线），证明了其模型在处理复杂、非标任务上的高效与稳定，从而推动行业估值逻辑从“硬件叙事”转向“模型叙事” [10][15][19][31] 行业现状与痛点 - 具身智能行业存在“虚火”，演示（Demo）动作在预设环境下流畅，但在真实混乱场景中往往错漏百出，陷入“四肢发达，头脑简单”的困境 [4][5] - 行业长期依赖在高度受控环境下采集的“干净数据”进行训练，导致模型过拟合，缺乏在真实物理世界中的泛化能力 [8][9] - 行业存在“重复造轮子”的痛点，每家机器人公司都试图从零训练自己的基础模型，造成资源浪费且水平参差不齐 [23] 千寻智能的技术突破 - Spirit v1.5采用了创新的VLA（Vision-Language-Action）统一架构，实现端到端的“直觉反应”，让机器人感知即行动，不同于传统的拼凑式模块 [10] - 公司构建了“先离散，后连续”的独特数据飞轮，并在物理世界验证了大模型Scaling Law的有效性 [11] - 模型训练数据源拥抱混乱，第一阶段预训练使用了海量、杂乱的互联网视频（如YouTube、爱奇艺）以学习物理世界的多样性，第二阶段才引入真实遥操作数据进行微调 [17] 商业化落地与成效 - 2025年底，千寻智能的人形机器人“小墨”已批量部署于宁德时代中州基地的电池PACK产线，这是全球首条人形机器人电池PACK产线 [15][16] - 在宁德时代的产线中，机器人处理高压、高精度的电池插接等“非标”场景，连续运行中插接成功率稳定在99%以上，单日工作量实现了3倍提升 [18][19] - 这一案例证明，在Spirit大模型加持下，机器人能够处理复杂工业任务，并在效率和良率上超越人类熟练工，使人形机器人从“展示品”变为实用工具 [18][19] 开源战略与行业影响 - 千寻智能通过开源Spirit v1.5，直接拉高了行业的“标准线”，旨在使其成为学界和产业界研究的基础（Baseline） [24] - 此举旨在抢占具身智能“通用大脑”的生态位，目标是使千寻智能转型为一家“赋能全球机器人公司”的平台型公司 [20][25] - 公司战略类似OpenAI，当模型能力形成真正的代际差时，仍握有转向闭源的主动权 [26] 行业范式转变 - 具身智能的竞争正从比拼硬件的“上半场”，迈入比拼大脑的“下半场” [6][30] - 行业正从“Demo时代”迈进需要拥抱混乱的“实战时代” [7] - 对于投资者，公司的估值逻辑正在重构，从对标发那科（Fanuc）的硬件制造商，转向对标OpenAI的AI平台公司 [31] - Spirit v1.5展现出的“一脑多形”能力，意味着其商业天花板不再受限于硬件产能，而取决于模型的泛化边界 [31] - 行业的真正壁垒，正在从硬件转向数据、模型、生态、标准 [32]