Pi0.5
搜索文档
速递 | 中国公司干翻硅谷!全球具身智能第一,完全开源
未可知人工智能研究院· 2026-01-13 11:02
文章核心观点 - 中国公司千寻智能凭借其开源的Spirit 1.5模型,在全球权威的具身智能真机评测榜单RoboChallenge Table30中夺得第一,标志着中国团队在该领域进入世界第一梯队 [1][2] - 千寻智能的成功源于其创新的“多样化采集”数据范式,利用真实世界的“脏数据”进行训练,显著提升了模型的迁移学习效率和泛化能力 [4][5] - 具身智能行业正处发展拐点,未来1-2年将出现明显分化,软硬一体、拥有产业资源和真实数据闭环的公司更可能胜出,并带来就业、产业及供应链等多重机会 [12][13][22] 行业竞争格局与公司定位 - 全球具身智能赛道玩家主要分为三派:以特斯拉、波士顿动力为代表的**硬件派**;以Physical Intelligence、Skild AI为代表的**软件派**;以及以千寻智能为代表的**软硬一体派** [11][12] - 千寻智能属于软硬一体派,同时拥有自研的Spirit大模型和自研的人形机器人Moz1,并能向其他硬件厂商提供算法解决方案 [12] - 软硬一体路线的核心优势在于能形成**数据闭环**,通过硬件收集真实场景数据持续训练模型,模型能力提升后又可反哺硬件表现,形成飞轮效应 [13] - 国内其他主要公司包括智元机器人、星动纪元、宇树科技等,其中宇树科技在四足机器人领域表现突出,但在“人形机器人+通用大模型”的路径上,千寻智能目前处于领先位置 [15] 技术突破与竞争优势 - 千寻智能的Spirit 1.5模型在RoboChallenge Table30榜单中取得**总分66.09分,成功率50.33%**,超越了此前排名第一、获得4亿美金融资的Physical Intelligence的模型Pi0.5(总分61.84分,成功率42.67%)[2][3] - 其技术核心是**“多样化采集”** 数据方案,放弃精心设计的固定任务演示,让机器人在实现大目标的过程中自主应对真实世界的复杂情况 [4] - 使用这种“脏数据”训练的模型,其**迁移学习效率比使用“干净数据”训练的模型高出40%**,学习新任务仅需后者六成的训练时间,且泛化能力更强 [4] - 该技术路径的优势在具体任务中得以体现,例如在插花等需要精细操作的任务上,Spirit 1.5因接触过更多真实世界的复杂情况,表现比主要在仿真环境中训练的Pi0.5更稳定 [14][15] 公司背景与资本认可 - 创始人韩峰涛为珞石机器人前CTO,拥有十余年机器人行业产业化经验;联合创始人高阳为清华姚班毕业、伯克利博士,师从具身智能领域泰斗Pieter Abbeel [6] - 公司成立于2024年2月,成立当年即完成3轮融资,2025年又完成Pre-A和Pre-A+轮融资,最新一轮融资额近**6亿元**,由**京东领投** [8] - 京东投资逻辑在于其自身拥有海量物流与零售场景,需要能实际干活的机器人,而千寻的机器人已能在办公室场景下完成桌面整理、扔垃圾等任务 [9] - 公司于去年被《The Information》评为“全球最具潜力创业公司”亚洲区第二名,该榜单素有“创业界奥斯卡”之称 [9] 发展前景与行业机会 - **2026年被认为是具身智能的量产元年**,行业将迎来大规模落地 [20] - 未来1-2年,行业将出现明显分化:纯软件公司若无法获取足够真实数据将掉队;纯硬件公司若模型能力不足将被边缘化;最终胜出者大概率是千寻这类**软硬一体且有产业资源背书**的公司 [22] - 京东在2025年7月连续投资千寻智能、逐际动力、众擎机器人三家具身智能头部公司,其背后逻辑是押注具身智能将成为未来十年的关键基础设施,类似2010年的云计算 [22] - 判断公司潜力的三个关键指标包括:**第三方榜单真实排名**、**真实的商业订单与落地场景**、以及团队是否**真正懂产业化** [25] 对从业者与产业的启示 - **就业机会**:三大方向人才紧缺,包括机器人算法工程师(需懂多模态大模型、强化学习)、场景解决方案专家、以及数据标注与采集工程师 [19] - **产业机会**:制造业可接触机器人公司进行产线试点;服务业(餐饮、酒店、养老)可提前布局以应对人力成本上升;供应链存在巨大机会,人形机器人涉及上千个零部件 [20] - **认知机会**:物理AI(具身智能)与ChatGPT等虚拟AI逻辑不同,它需要在真实世界中负责任地行动,将重新定义安全标准、伦理边界和法律责任,提前理解这一转变具有战略优势 [20]
具身开源模型新王!千寻Spirit v1.5模型登顶 RoboChallenge,终结 Pi0.5领跑时代
量子位· 2026-01-12 08:37
Spirit v1.5模型性能表现 - 千寻智能的具身智能基础模型Spirit v1.5在RoboChallenge真机评测榜上,以总分66.09、成功率50.33%的成绩超越美国公司Physical Intelligence的Pi0.5,登顶榜首[1] - Spirit v1.5是RoboChallenge自上线以来,首个击败基准模型Pi0.5的国产具身模型,同时也是首个在该榜单上成功率超过50%的具身智能模型[3] - 在“寻找绿盒”任务中,Spirit v1.5的成功率达到90%,显著领先于Pi0.5的80%和Pi0的70%[11][12] - 在“水果入篮”任务中,Spirit v1.5以80%的成功率领先Pi0.5(40%)整整一倍[14] - 在“贴胶带”任务中,Spirit v1.5以20%的成功率实现对比Pi0.5(10%)的翻倍领先[20] - 在“插花”任务中,虽然Spirit v1.5与Pi0.5成功率均为50%,但Spirit v1.5的稳定性更高,没有出现极端的失败案例[16] 技术路径与数据策略 - Spirit v1.5的核心创新在于预训练阶段的数据策略,从高度精选、强控制的“干净数据”转向多样化、开放式、弱控制的数据采集范式[33][34] - 开放式采集鼓励数据采集员围绕任务目标自由行动,而非遵循固定流程,使数据连续覆盖抓取、插入、整理、双臂协作等大量原子技能[40][41][43] - 该数据策略带来工程收益:人均有效采集时长提升约200%,对算法专家深度介入的需求降低约60%[45] - 消融实验显示,在预训练数据规模一致的前提下,采用多样化预训练的模型在新任务上达到相同性能时,所需迭代次数减少约40%[47] - 研究表明,对具身模型而言,任务多样性比单一任务的演示数量更为关键,模型学到的是可迁移的通用策略[52] RoboChallenge基准测试平台 - RoboChallenge由Dexmal原力灵机联合Hugging Face发起,是首个在真实物理环境中由真实机器人执行操作的大规模、多任务基准测试,被誉为具身智能的“ImageNet”[8][25] - 其Table30任务集通过30个高频桌面及周边日常场景,从视觉语言动作模型难点、机器人形态、任务流程与物体属性等维度考察模型真实世界通用操作能力[25] - 平台采用远程机器人范式,参赛者通过HTTP接口向机器人发送控制指令,显著降低参赛门槛,并使不同算法能在同一套真实硬件条件下接受统一评测[27][29] - 平台区分任务特定与通用型两种训练协议,榜单中带有“/multi”后缀的模型遵循更具挑战性的通用型设定[32] 公司背景与行业影响 - Spirit v1.5的研发团队千寻智能成立于2024年1月,是一家具备AI+机器人全栈技术能力的具身智能公司,常被称为“中国版Figure”[57][58][59] - 公司创始人兼CEO韩峰涛为机器人行业连续创业者,曾主导交付超2万台工业机器人;联合创始人兼首席科学家高阳为清华交叉信息研究院助理教授,其提出的ViLa算法被Figure采用[61] - 2025年,千寻智能完成超15亿元融资,其中PreA+轮由京东领投6亿元[61] - 公司通用人形机器人“小墨”已于2025年底在宁德时代电池产线规模化落地,精细作业成功率突破99%[61] - Spirit v1.5同步开源了模型权重、推理代码及使用样例,其登顶成绩及开源举措意味着技术进展被放入开源体系,旨在与社区共同推动具身智能发展[7][56][68][71]