Spirit v1.5模型性能表现 - 千寻智能的具身智能基础模型Spirit v1.5在RoboChallenge真机评测榜上,以总分66.09、成功率50.33%的成绩超越美国公司Physical Intelligence的Pi0.5,登顶榜首[1] - Spirit v1.5是RoboChallenge自上线以来,首个击败基准模型Pi0.5的国产具身模型,同时也是首个在该榜单上成功率超过50%的具身智能模型[3] - 在“寻找绿盒”任务中,Spirit v1.5的成功率达到90%,显著领先于Pi0.5的80%和Pi0的70%[11][12] - 在“水果入篮”任务中,Spirit v1.5以80%的成功率领先Pi0.5(40%)整整一倍[14] - 在“贴胶带”任务中,Spirit v1.5以20%的成功率实现对比Pi0.5(10%)的翻倍领先[20] - 在“插花”任务中,虽然Spirit v1.5与Pi0.5成功率均为50%,但Spirit v1.5的稳定性更高,没有出现极端的失败案例[16] 技术路径与数据策略 - Spirit v1.5的核心创新在于预训练阶段的数据策略,从高度精选、强控制的“干净数据”转向多样化、开放式、弱控制的数据采集范式[33][34] - 开放式采集鼓励数据采集员围绕任务目标自由行动,而非遵循固定流程,使数据连续覆盖抓取、插入、整理、双臂协作等大量原子技能[40][41][43] - 该数据策略带来工程收益:人均有效采集时长提升约200%,对算法专家深度介入的需求降低约60%[45] - 消融实验显示,在预训练数据规模一致的前提下,采用多样化预训练的模型在新任务上达到相同性能时,所需迭代次数减少约40%[47] - 研究表明,对具身模型而言,任务多样性比单一任务的演示数量更为关键,模型学到的是可迁移的通用策略[52] RoboChallenge基准测试平台 - RoboChallenge由Dexmal原力灵机联合Hugging Face发起,是首个在真实物理环境中由真实机器人执行操作的大规模、多任务基准测试,被誉为具身智能的“ImageNet”[8][25] - 其Table30任务集通过30个高频桌面及周边日常场景,从视觉语言动作模型难点、机器人形态、任务流程与物体属性等维度考察模型真实世界通用操作能力[25] - 平台采用远程机器人范式,参赛者通过HTTP接口向机器人发送控制指令,显著降低参赛门槛,并使不同算法能在同一套真实硬件条件下接受统一评测[27][29] - 平台区分任务特定与通用型两种训练协议,榜单中带有“/multi”后缀的模型遵循更具挑战性的通用型设定[32] 公司背景与行业影响 - Spirit v1.5的研发团队千寻智能成立于2024年1月,是一家具备AI+机器人全栈技术能力的具身智能公司,常被称为“中国版Figure”[57][58][59] - 公司创始人兼CEO韩峰涛为机器人行业连续创业者,曾主导交付超2万台工业机器人;联合创始人兼首席科学家高阳为清华交叉信息研究院助理教授,其提出的ViLa算法被Figure采用[61] - 2025年,千寻智能完成超15亿元融资,其中PreA+轮由京东领投6亿元[61] - 公司通用人形机器人“小墨”已于2025年底在宁德时代电池产线规模化落地,精细作业成功率突破99%[61] - Spirit v1.5同步开源了模型权重、推理代码及使用样例,其登顶成绩及开源举措意味着技术进展被放入开源体系,旨在与社区共同推动具身智能发展[7][56][68][71]
具身开源模型新王!千寻Spirit v1.5模型登顶 RoboChallenge,终结 Pi0.5领跑时代
量子位·2026-01-12 08:37