Spirit v1.5
搜索文档
具身智能行业周报:逐际动力发布COSA系统 自变量机器人完成10亿融资
新浪财经· 2026-01-18 16:33
行业核心观点 - 机器人行业景气度加速向上 特斯拉新一代机器人发布在即 春晚机器人再度登台 [1] - 2026年是人形机器人从0到1兑现的重要节点 特斯拉链预计在2026年第一季度发布第一代量产产品 2026年上半年供应链大批量产线建设完成 2026年8月开启大规模量产 [3] - 国产链头部本体出货量规模有望从数千台跨越到数万台 [3] 技术进展与模型突破 - 千寻智能具身智能模型Spirit v1.5在第三方机器人模型评测榜单RoboChallenge上登顶第一 超越了国外知名模型pi0.5 成为唯一成功率突破50%的模型 [1] - 千寻智能已将Spirit v1.5模型权重、训练代码及评测实现完全开源 [1] - 逐际动力发布具身智能体系统LimX COSA 这是一个面向物理世界原生的具身Agentic OS 通过将高阶认知与全身运控深度融合 实现“能想、能动、边思考边干活”的大小脑一体化智能 [1] - 全尺寸人形机器人Oli在COSA系统驱动下 成为兼具运动智能和高阶认知的人形智能体 [1] - 挪威人形机器人公司1X发布全新世界模型“1X World Model” [4] - 乐聚发布全国首个工业具身软件平台Taskor [4] 公司融资与资本动态 - 具身智能企业自变量机器人已完成10亿元A++轮融资 投资方包括字节跳动、红杉中国、北京信息产业发展基金、深创投、南山战新投、锡创投等 [2] - 融资金额将主要投向通用具身智能基础模型迭代、软硬一体产品化 以及在更多高价值场景的部署与交付 [2] - 自变量机器人已发布“量子一号”、“量子二号”两款机器人本体 并实现机械臂、关节模组、动力驱动器等核心零部件的自主研发 [2] - Skild AI宣布完成约14亿美元的C轮融资 [4] 产业链合作与商业化落地 - 星动纪元与顺丰科技正式签约达成深度合作 双方将聚焦快递、仓储等物流场景 联合开展具身智能机器人技术方案的研发与应用推广 [2] - 星动纪元已推出覆盖“分拣-扫码-供件”全流程的具身智能仓储物流解决方案 [2] - 顺丰科技将依托其自研的“百川”数智化供应链平台和“顺丰超脑”智能决策平台 为星动L7/M7机器人提供场景支持 [2] - 该合作旨在推动具身智能机器人在物流行业规模化落地 全面提升物流作业效率与质量 [2] 投资方向与产业链机会 - 全球将迈入机器人“军备竞赛” 重点关注五大方向 [3] - 方向一:特斯拉链的收敛 硬件供应链趋于收敛的拐点 重点关注拓普集团、三花智控等 [3] - 方向二:技术迭代与收敛 看好电驱动新技术、灵巧手、新材料、高端轴承等 重点关注宁波华翔及其他相关标的 [3] - 方向三:海外其他供应链的机会 苹果、谷歌、OpenAI、Figure等都陆续迈入0-1 重点关注银轮股份以及电子链标的相关机会 [3] - 方向四:国内本体和应用垂类机会 宇树、智元、乐聚、银河通用等陆续上市 关注供应链以及本体标的翔楼新材、柯力传感等 [3] - 方向五:围绕长期确定性 布局“优质格局”的标的 重点关注奥比中光、宁波华翔等 [3] 政策与行业事件 - 浙江省经信厅发布《浙江省“十五五”新型工业化规划(征求意见稿)》 [4]
具身智能行业研究:逐际动力发布COSA系统,自变量机器人完成10亿融资
国金证券· 2026-01-18 15:35
报告行业投资评级 * 报告未明确给出统一的行业投资评级,但在投资建议部分对多个细分方向及具体公司给出了关注建议 [48] 报告核心观点 * 机器人行业景气度加速向上,产业呈现多维突破态势,2026年有望成为人形机器人规模量产元年 [4][9][17] * 行业动态正从政策引导转向商业化落地,推动具身智能产业长期发展 [8][10] * 2026年是人形机器人从0到1兑现的重要节点,全球将迈入机器人“军备竞赛”,龙头公司供应链和技术将趋于收敛 [4][48] 一、机器人行业动态 * **政策与宏观**:工信部提出加快培育具身智能装备等工业场景智能体 [10];《浙江省“十五五”新型工业化规划(征求意见稿)》提出重点发展人形机器人整机及核心部件 [10];2025年我国工业机器人出口同比增长48.7%,首次成为净出口国 [10][15] * **产业链生态**:产业链协同与生态构建加速,乐聚发布全国首个工业具身软件平台Taskor,推动人形机器人从“单台演示”迈向“整厂部署” [9][10][16];全球机器人租赁生态联盟正式成立 [10][15] * **资本动向**:资本密集注入,国内自变量机器人完成10亿元A++轮融资 [3][10][11];美国Skild AI完成约14亿美元(约合人民币97.6亿元)C轮融资,估值超140亿美元(约合人民币976.3亿元),为7个月前的3倍 [10][11][15][17] 二、本体公司进展 * **千寻智能**:旗下端到端具身智能模型Spirit v1.5在第三方评测榜单RoboChallenge上登顶第一,成功率突破50%,超越国外模型pi0.5,并将模型完全开源 [2][16][17][26] * **逐际动力**:发布具身智能体系统LimX COSA,通过高阶认知与全身运控深度融合,实现机器人“能想、能动、边思考边干活”的大小脑一体化智能 [2][9][16][28] * **自变量机器人**:完成10亿元A++轮融资,由字节跳动、红杉中国等机构投资,融资将用于基础模型迭代与产品化 [3][10][11][31];已发布“量子一号”、“量子二号”机器人本体,并实现核心零部件自研以降低成本 [3][33] * **智元机器人**:海外首家体验馆在马来西亚开业,标志其全球化战略布局 [9][16];全球市场研究机构Omdia报告显示,智元以绝对优势斩获2025年全球人形机器人出货量与市场份额双第一 [23] * **其他本体公司**:未来不远完成2亿元天使轮融资,其家务机器人已进入超200个真实家庭,累计服务超21238小时 [16][21];星动纪元与顺丰科技达成深度合作,聚焦物流场景 [3][36];乐聚发布工业具身软件平台Taskor [10][16][17] 三、核心零部件与供应链 * **富临精工**:筹划引入宁德时代作为战略投资者,融资拟用于机器人智能电关节等项目,相关产品已小批量生产 [36][38][44][45] * **鹿山新材**:正式发布离电型温压双模态电子皮肤产品,进军人形机器人“电子皮肤”赛道 [36][37][41][46] * **战略合作**:舍弗勒与英国人形机器人企业Humanoid建立战略技术合作关系,聚焦创新部件研发与供应,计划未来五年引入数百台机器人至生产设施 [36][37][41] * **其他融资**:眸深智能完成超千万元天使轮追加投资 [36][41];深穹星核完成数千万元人民币天使轮融资 [36][41];江苏华旋传感完成新一轮战略融资,用于人形机器人关节传感器等产品线扩产 [36][37][43] 四、投资建议与关注方向 * **特斯拉链收敛**:特斯拉链已迭代4年,硬件供应链趋于收敛,建议关注拓普集团、三花智控等 [4][48] * **技术迭代与收敛**:看好电驱动新技术、灵巧手、新材料、高端轴承等,建议关注宁波华翔及其他相关标的 [4][48] * **海外其他供应链机会**:苹果、谷歌、OpenAI、Figure等陆续迈入0-1阶段,建议关注银轮股份以及电子链相关机会 [4][48] * **国内本体和应用垂类机会**:宇树、智元、乐聚、银河通用等陆续上市,建议关注供应链及本体相关标的 [4][48] * **布局“优质格局”标的**:围绕长期确定性,建议关注奥比中光、宁波华翔等 [4][48]
对话千寻智能韩峰涛:真正的机器人是生产力,不是展品和玩具
雷峰网· 2026-01-13 18:20
文章核心观点 - 千寻智能开源了其具身模型Spirit v1.5,该模型在RobotChallenge榜单中超越国际标杆Pi0.5,成为全球最强开源具身模型,标志着公司技术达到领先水平 [3] - 创始人韩峰涛判断,2026年将是具身智能行业的“GPT时刻”,模型能力将通过Scaling Law快速攀升,行业将进入大规模融资和快速发展阶段,类似于2023年的大语言模型 [6][44] - 具身智能发展的核心瓶颈在于数据,公司采取“模型与硬件并举”的全栈策略,通过自研硬件和自建近千人规模的数据工厂来采集高质量的真实数据,以驱动模型进化并启动数据飞轮 [6][36] 中国机器人行业发展阶段与现状 - 中国工业机器人市场占有率从2015年的约3%跃升至2024年的50%以上,国产化替代在2019年至2023年间快速完成 [13] - 中国机器人行业的发展可分为四个阶段:2010年前全进口、2010-2020年发展期、2020年后疫情助推国产占有率提升、2024年起进入以“大脑”(AI)为核心的具身智能竞争时代 [13][14] - 在当前的具身智能时代,中国公司与海外对手已处于齐头并进的状态,改变了以往在工业机器人和自动驾驶领域追赶的局面 [14][17] - 中国供应链的核心优势在于极快的迭代速度,硬件问题可在“24小时包邮区”内以天为单位解决,这为产品快速迭代提供了巨大优势 [15] 具身智能的时代机遇与公司战略 - 当前具身智能兴起的核心变量是AI技术的革命性进步,使得机器人的“大脑”真正可用,因此公司的核心命题是如何让具身模型进化 [9][20] - 公司认为具身智能的商业逻辑更接近“自动驾驶的新能源车”,必须同时掌握“灵魂”(软件模型)和“躯体”(硬件本体),只卖模型的商业模式目前基本不存在 [26] - 公司创业认知发生关键转变:从第一次创业“拿着锤子找钉子”(基于自身技能)转变为第二次创业“时代需要什么就干什么”(抓住AI与具身模型的核心机遇) [18] - 公司定位为“千寻智能”而非“千寻机器人”,强调其本质是AI公司,Embodied AI的核心是AI [10][18] 模型进展、能力衡量与商业化路径 - Spirit v1.5在移除实验室“温室”条件的RobotChallenge测试中,在30个桌面项目上取得了超过50%的任务成功率,对比Pi0.5的42.67% [6] - 公司用自动驾驶的“L级别”概念衡量具身模型进化:L0(基础工业机器人)、L1(能完成单一复杂任务如叠衣服)、L2(能完成一连串任务) [32] - 公司模型在2025年底处于约L1.8水平,预计2026年夏天可达L2水平 [32] - 真正的量产(指能“干活”的生产力机器人)预计在2026年底 [27] - 公司训练数据效率较高,完成叠衣服任务仅需100多小时数据,而国内竞对需要上千或大几百小时 [40] 数据的关键作用与采集策略 - 数据数量与质量决定模型质量,当前全球领先的具身模型公司(如PI与千寻)的真机数据总计仅约1万小时,而达到较好模型效果可能需要100万小时数据 [36][40] - 具身智能发展慢于大语言模型和自动驾驶,主要原因是缺乏类似互联网的现成数字资产,且没有“大脑”的机器人无法销售,导致数据飞轮难以启动 [9][37] - 公司解决方案是自建数据工厂,计划在2026年将采集工位从目前的四五十个增加超过10倍,并采用可穿戴设备让人在真实场景中“一边干活一边采数” [36][38] - 数据分为用于预训练的海量通用数据和用于微调的特定场景数据,后者部分将由客户使用公司提供的设备在其现场采集 [39] 硬件自研的逻辑与产品规划 - 自研硬件的核心目的是为模型提供更高质量、同构的真实数据,因为“模型跟硬件是绑定的”,联合设计、软硬一体效果最好 [6][23] - 硬件产品遵循“沿途下蛋”策略,基于当前成熟技术推出可量产的产品(如三指手),以支撑公司运营,同时为模型进化服务 [23] - 公司硬件研发聚焦上半身(一体化关节、手臂、感知系统、三指手),认为双腿对普通家用机器人意义不大,优先解决轮式底盘能到之处的任务 [43] - 公司目前团队约110人,其中模型与硬件团队各约40人 [43] 对2026年的行业展望与公司计划 - 2026年被预判为具身智能的“大年”,模型能力将开始快速进化,行业将出现大规模融资,类似2023年的大语言模型领域 [6][44] - 公司计划在2026年为冲击L2模型进行大规模融资 [44] - 行业竞争将聚焦于通用大脑,而竞争的关键在于数据 [35][36] - 2026年也将是模型“打榜”的年份,开源榜单测评将成为衡量模型能力的重要方式 [41]
腾讯研究院AI速递 20260113
腾讯研究院· 2026-01-13 00:37
谷歌推出通用商业协议UCP - 谷歌联合Shopify、沃尔玛等超过20家零售巨头推出通用商业协议,为AI智能体购物建立统一开放标准,覆盖从商品发现到售后的全流程 [1] - 该协议已在谷歌搜索AI模式和Gemini应用中实现“智能体结账”功能,支持Google Pay并即将接入PayPal,零售商在交易中保持主体身份 [1] - 谷歌将UCP完全开源,兼容智能体支付协议、A2A协议和MCP等多种协议,旨在降低生态参与门槛,让中小商家也能享受AI购物红利 [1] Midjourney更新Niji v7动漫模型 - Midjourney联合Spellbrush推出Niji v7动漫专属模型,修正了v6版本偏写实的倾向,回归纯动漫感,在眼神细节、动态肢体和材质质感上全面提升 [2] - 新增sref风格参考功能,支持上传3张参考图以保持统一画风,模型理解能力大幅提升,能准确识别“四只手每只拿冰淇淋”等复杂提示词 [2] - 实测显示,v7版本在光影细节、复杂姿势稳定性和纯动漫线条质感上全面超越v6,特别适合分镜生成和系列化创作 [2] BabyVision评测揭示VLM视觉短板 - UniPat AI联合红杉中国xbench等机构发布BabyVision评测基准,将视觉能力拆分为精细辨别、视觉追踪、空间感知、视觉模式识别四大类共22个子任务 [3] - 评测结果显示,Gemini-3-Pro-Preview是唯一超过3岁儿童基线的模型,但距离6岁儿童水平仍差20个百分点,在“连线找垃圾桶”等简单任务上模型集体表现不佳 [3] - 研究揭示视觉语言模型的最大短板是无法将视觉信息完整语言化,这些“unspeakable”视觉题在压缩成token时细节丢失,导致模型难以完成追线、数积木等任务 [3] 昆仑万维推出Skywork Video v1.0 - 昆仑万维在天工超级智能体上推出Skywork Video v1.0,采用“项目制”整合创作流程,所有素材自动归集并可一键添加至多轨道编辑器 [4] - 提供文本生成、图片动效、首尾帧补全、多图风格参考生成及数字人视频生成五种启动方式,内置多轨道编辑器支持分割、替换等精细操作 [4] - Skywork产品矩阵已完成从文档、表格、演示文稿到视频生成的全模态覆盖,构建了一个覆盖多场景、支持多模态的智能办公平台 [4] 逐际动力发布具身Agentic OS - 逐际动力发布全球首个具身Agentic OS——COSA系统,采用三层架构实现大小脑一体化融合 [5][6] - COSA赋予机器人理解模糊指令、跨时间语义记忆和“想到就能做到”三大核心能力,其机器人Oli实现了“移动-操作-移动”一镜到底的操作 [6] - 与Figure AI的Helix端到端VLA模型不同,COSA从架构底层构建面向物理世界的操作系统,在移动操作融合能力上展现出明显优势 [6] 千寻智能开源VLA模型Spirit v1.5 - 千寻智能开源视觉语言动作基础模型Spirit v1.5,在RoboChallenge的Table30榜单上位列第一,超越了Pi0.5,并获得英伟达Jim Fan的点赞 [7] - Spirit v1.5的核心突破在于采用“开放式、目标驱动”的数据采集策略,摒弃“干净数据”转向内化物理常识,其多样化数据使微调收敛速度提升了40% [7] - 非结构化的采集方式使人均有效采集时长增加了200%,对算法专家的依赖降低了60%,公司开源了模型权重和推理代码供社区复现探索 [7] Anthropic联创对AI开发效率的观察 - Anthropic联合创始人Jack Clark透露内部调查存在矛盾数据:60%的Claude使用者自报生产力提升了50%,但METR研究显示,熟悉代码库的开发者使用AI工具后,PR合并速度反而下降了20% [8] - Clark指出代码生产存在“木桶原理”,即写代码速度可能快10倍但审查速度只提升2倍,因此整体效率不会爆炸式增长,并强调截至2026年1月地球上还不存在真正递归自我改进的AI [8] - 他强调如果Scaling Law真的撞墙将是最令人震惊的事,当前巨额的基础设施投资表明大多数人押注相反结果,分布式预训练若取得突破将改变AI的政治经济结构 [8] Linux之父使用AI工具开发项目 - Linux之父Linus Torvalds在GitHub发布了首个Vibe Coding项目AudioNoise,该项目使用谷歌Antigravity生成Python可视化工具,他坦言效果“比自己写的好” [9] - 该项目灵感源自吉他效果器板设计,主要探索数字音频处理基础知识,包含IIR滤波器和延迟循环等零延迟单采样处理 [9] - 仅在5天前的1月7日,Torvalds还在内核开发讨论中批评AI生成垃圾代码“愚蠢至极”,此次开源使用AI工具引发了圈内的“真香时刻”热议 [9] 马斯克关于AI与未来的预测 - 马斯克预测人工智能将在2026年达到AGI,2030年AI智能将超越全人类智能总和,AI性能每年以10倍速度提升,其xAI的孟菲斯Colossus 2数据中心将在1月中旬达到1吉瓦功率 [10] - 他提出AI安全的三个关键词,预测三年后Optimus机器人的手术水平将超越顶级外科医生,五年内机器人将从稀缺变为充裕,到2040年将达到100亿台 [11] - 马斯克强调“太阳是一切”的能源观点,赞赏中国太阳能年产能达到1500吉瓦,预测未来货币的本质是瓦特,并认为白领工作将最先被AI替代,但最终将实现全民富足 [11]
被Jim Fan点赞!全球第一的千寻智能Spirit v1.5正式开源!
机器之心· 2026-01-12 09:20
具身智能行业格局与关键事件 - 2025年是具身智能大爆发的一年,硬件表现活跃,但具身智能与机器人基础模型(即“大脑”)是定义智力天花板和行业“通用性”解释权的关键赛道[3] - 过去两年,该赛道叙事主线由Pi、Google、Figure等海外团队主导,但格局在2026年初发生变化[4] - 2026年1月12日,中国公司千寻智能(Spirit AI)开源了自研的视觉语言动作(VLA)基础模型Spirit v1.5[4] - Spirit v1.5在第三方机器人真机评测平台RoboChallenge的Table30榜单上位列第一,得分66.09,成功率为50.33%,超过了此前最强的模型Pi0.5(得分61.84,成功率42.67%)[11] - 此举意味着在具身智能核心战场上,中国团队结束了“跟随模式”,正式进入“全球第一梯队”[14] Spirit v1.5的技术突破与核心优势 - 模型胜出的核心在于对机器人预训练数据范式的根本性重构,从依赖“干净数据”转向学习“物理常识”[18][19] - 传统模型基于Open X-Embodiment (OXE)、Agibot和RoboCOIN等高度精选的“干净”数据集训练,场景被精心设计,限制了模型的泛化能力[20] - Spirit v1.5采用“开放式、目标驱动”的数据采集策略,只给操作员模糊的高层目标(如“清理厨房”),允许其即兴发挥,从而获得多样化、非结构化的数据[20] - 新策略带来的优势包括:构建了连续的技能流形,使模型能学习动作间的过渡与衔接[21];内化了纠错与恢复能力,使模型在面对干扰时能动态调整,展现出类似人类的“物理常识”[22] - 技术报告中的消融实验证实,其优势源于更高效的数据利用策略,而非算力扩张[24]:使用多样化数据训练的模型,在针对新任务微调时,达到相同性能基线所需的迭代次数比基线模型少了40%[25];随着多样化数据规模扩大,模型在新任务上的验证误差持续下降[27] Spirit v1.5的工程与产业价值 - 模型解决了行业在可扩展性上的难题,其非结构化采集方式带来了显著的工程效益[31]:人均有效采集时长增加了200%[38];对算法专家干预的需求削减了60%[38] - 千寻智能将模型的基模权重、推理代码及使用样例全部开源,接受公众检验并方便社区创新[6][33] - 开源举措具有重要产业意义:为科研界提供了可复现的强基线[39];为产业界,特别是中小型厂商,提供了经过验证、可商用的技术底座,避免了重复造轮子[39] - 此举标志着中国团队正将大语言模型(LLM)领域的开源繁荣延续到具身智能领域,从全球AI生态的“参与者”转变为关键基础设施的“建设者”[35][37][40] 行业影响与未来意义 - Spirit v1.5的出现具有明确的界碑意义,它通过实验证明了“非结构化的多样性是比精选数据更好的老师”[42] - 中国团队在具身智能领域已具备在核心技术路径(数据范式)与生态建设上与全球顶尖团队“对等对话”甚至“定义规则”的能力[42] - 高性能机器人基础模型(如Google RT系列或Pi)大多处于闭源或半闭源状态,制约了产业落地速度,Spirit v1.5的开源填补了“基座缺失”[36] - 真正的考验在于模型能否在真实世界的千万种场景中,经受住全球开发者的验证与打磨[42]
从全球首条产线落地到模型世界第一!千寻智能引领具身智能的Deepseek时刻
机器人大讲堂· 2026-01-12 08:40
文章核心观点 - 千寻智能自研的具身智能基础模型Spirit v1.5,在权威评测与真实工业场景应用中均取得突破性进展,标志着国产具身模型在性能与可用性上达到国际先进水平,并成功从技术探索迈入实用化阶段 [2][4][26][28] RoboChallenge评测与Spirit v1.5的技术领先性 - 2026年初,千寻智能Spirit v1.5模型在第三方机器人模型评测组织RoboChallenge的Table30榜单上位列第一,得分66.09,任务成功率50.33%,超越了此前最强的Pi0.5模型(得分61.84,成功率42.67%)[2][11] - RoboChallenge是国内目前为数不多甚至唯一的具身模型评测榜单,其核心优势在于“真机实测”,通过统一任务标准、评估指标和跨模型对照机制,构建开放公正的评测环境,全面检验VLA算法在物理世界的泛化能力 [5][7] - Table30任务集涵盖插花、整理碗碟、开关水龙头等30个真实场景,全面考察3D定位、遮挡处理等技术难点,评估机制结合端到端任务成功率与过程评分,能客观反映算法真实能力 [9][10] - Spirit v1.5的技术核心源于开放式、目标驱动的多样化数据采集范式,摒弃脚本化约束,鼓励采集员即兴完成目标任务,形成包含多样化原子技能的连续数据流 [13] - 这种训练方式使模型积累了更全面的物理常识与技能连接能力,在迁移学习中表现突出:达到相同性能所需的微调迭代次数减少40%,且随着数据规模扩大,模型在新任务上的验证误差持续下降 [16] Spirit v1.5在工业场景的落地验证 - 搭载Spirit v1.5模型的人形机器人“小墨”,已于2025年12月底落地宁德时代中州基地(按“灯塔工厂”标准打造),正式投入新能源动力电池PACK生产线运行 [4][17] - “小墨”主要负责电池包下线前终检、耐压测试等关键工序,具体完成高压测试插头精准插接、线束连接状态检测及设备巡检等任务 [19] - 官方数据显示,“小墨”机器人在PACK生产线的插接成功率超过99%,作业效率较人工提升三倍,有效规避了人工操作的高压安全风险 [19] - 在宁德时代产线的稳定运行,证明Spirit v1.5模型已具备工业级场景的工程化应用能力,能够应对复杂工况的严苛考验 [17][19] 对行业的意义与影响 - 千寻智能的技术能力同步通过了RoboChallenge评测的“上限验证”与宁德时代产线的“下限验证”,这种“能比又能用”的双重验证,构成了具身智能领域真正具备产业价值的领先范式,解决了行业技术与产业脱节的核心痛点 [21][23] - 对于机器人厂商而言,千寻智能的突破意味着国产具身模型已具备从“备选项”升级为“主选项”的条件,证明国产模型在技术实力上已能与国际顶尖产品抗衡,且在工程化适配、本地化服务等方面更具优势 [26] - 对于系统集成商,千寻智能在宁德时代产线的成功落地提供了可参考的工业级应用案例,证明国产具身模型的工程化可靠性,将显著降低自动化项目实施风险,加速方案落地进程 [26] - 这是中国具身模型首次在“全球顶级评测+头部制造业产线”双重标准下获得验证,标志着中国在具身智能领域的技术实力和产业化能力已达到国际先进水平,行业正式从技术探索期迈入实用化阶段 [26][28]
具身开源模型新王!千寻Spirit v1.5模型登顶 RoboChallenge,终结 Pi0.5领跑时代
量子位· 2026-01-12 08:37
Spirit v1.5模型性能表现 - 千寻智能的具身智能基础模型Spirit v1.5在RoboChallenge真机评测榜上,以总分66.09、成功率50.33%的成绩超越美国公司Physical Intelligence的Pi0.5,登顶榜首[1] - Spirit v1.5是RoboChallenge自上线以来,首个击败基准模型Pi0.5的国产具身模型,同时也是首个在该榜单上成功率超过50%的具身智能模型[3] - 在“寻找绿盒”任务中,Spirit v1.5的成功率达到90%,显著领先于Pi0.5的80%和Pi0的70%[11][12] - 在“水果入篮”任务中,Spirit v1.5以80%的成功率领先Pi0.5(40%)整整一倍[14] - 在“贴胶带”任务中,Spirit v1.5以20%的成功率实现对比Pi0.5(10%)的翻倍领先[20] - 在“插花”任务中,虽然Spirit v1.5与Pi0.5成功率均为50%,但Spirit v1.5的稳定性更高,没有出现极端的失败案例[16] 技术路径与数据策略 - Spirit v1.5的核心创新在于预训练阶段的数据策略,从高度精选、强控制的“干净数据”转向多样化、开放式、弱控制的数据采集范式[33][34] - 开放式采集鼓励数据采集员围绕任务目标自由行动,而非遵循固定流程,使数据连续覆盖抓取、插入、整理、双臂协作等大量原子技能[40][41][43] - 该数据策略带来工程收益:人均有效采集时长提升约200%,对算法专家深度介入的需求降低约60%[45] - 消融实验显示,在预训练数据规模一致的前提下,采用多样化预训练的模型在新任务上达到相同性能时,所需迭代次数减少约40%[47] - 研究表明,对具身模型而言,任务多样性比单一任务的演示数量更为关键,模型学到的是可迁移的通用策略[52] RoboChallenge基准测试平台 - RoboChallenge由Dexmal原力灵机联合Hugging Face发起,是首个在真实物理环境中由真实机器人执行操作的大规模、多任务基准测试,被誉为具身智能的“ImageNet”[8][25] - 其Table30任务集通过30个高频桌面及周边日常场景,从视觉语言动作模型难点、机器人形态、任务流程与物体属性等维度考察模型真实世界通用操作能力[25] - 平台采用远程机器人范式,参赛者通过HTTP接口向机器人发送控制指令,显著降低参赛门槛,并使不同算法能在同一套真实硬件条件下接受统一评测[27][29] - 平台区分任务特定与通用型两种训练协议,榜单中带有“/multi”后缀的模型遵循更具挑战性的通用型设定[32] 公司背景与行业影响 - Spirit v1.5的研发团队千寻智能成立于2024年1月,是一家具备AI+机器人全栈技术能力的具身智能公司,常被称为“中国版Figure”[57][58][59] - 公司创始人兼CEO韩峰涛为机器人行业连续创业者,曾主导交付超2万台工业机器人;联合创始人兼首席科学家高阳为清华交叉信息研究院助理教授,其提出的ViLa算法被Figure采用[61] - 2025年,千寻智能完成超15亿元融资,其中PreA+轮由京东领投6亿元[61] - 公司通用人形机器人“小墨”已于2025年底在宁德时代电池产线规模化落地,精细作业成功率突破99%[61] - Spirit v1.5同步开源了模型权重、推理代码及使用样例,其登顶成绩及开源举措意味着技术进展被放入开源体系,旨在与社区共同推动具身智能发展[7][56][68][71]
「死了么」爆红:付费人数翻了200倍,估值达1000万;曝DeepSeek V4大模型春节前后发布;马斯克宣布将开源X最新算法
雷峰网· 2026-01-12 08:27
AI与机器人技术 - 千寻智能开源自研VLA模型Spirit v1.5,在RoboChallenge的Table30榜单上超越之前最强模型pi0.5登顶[4] - Spirit v1.5在单/双臂多种构型下展现出卓越的3D定位、抗遮挡及长序列任务处理能力,解决了pi0.5无法应对的复杂物理交互问题[6] - 深度求索(DeepSeek)预计将在农历新年前后推出新一代旗舰AI模型V4,内部测试显示其在代码生成领域表现优于Anthropic Claude和OpenAI GPT系列[11] - V4模型在超长代码提示词处理与解析方面实现技术突破,且训练全流程中对数据模式的理解能力得到优化,未出现性能衰减[12] - 腾讯新任首席AI科学家姚顺雨指出,AI在To C和To B领域的应用落地分化明显,Claude Code已在重塑整个计算机行业的做事方式[24][25] 汽车行业动态 - 前比亚迪腾势品牌总经理赵长江转发余承东关于智界V9的微博并高度评价,其微博IP地址显示为安徽,为加盟奇瑞与华为合作的智界品牌传闻增添可信度[16] - 比亚迪旗下新增全新汽车品牌“领汇”,该品牌主要面向B端市场,整合原对公事业部e系列车型,旨在推动公司高端化战略[18] - 2025年比亚迪全年累计销量超过460万辆,同比增长7.73%,其中定位高端的腾势品牌年销量约18万辆[18] - 网传大众迈腾380豪华版裸车价12.99万元,但4S店销售称该价格不可能,实际开票价约15.7万元,落地价17万多元,网传信息疑似不良商家低价引流套路[22] - 吉利控股正考虑向美国市场扩张,极氪和领克等品牌或是首选,公司可能在未来24至36个月内发布相关计划[40] 消费电子与互联网应用 - 一款针对独居人群的应用“死了么”爆红,冲至苹果AppStore付费下载榜第一,付费人数翻了200倍,估值达1000万元[8] - 由于技术壁垒不高,模仿者迅速入场,一款功能相似的“活了么”App已上架并提供免费下载[9] - 魅族因内存价格大幅上涨,取消了魅族22 Air的上市计划,并预告年度旗舰魅族23将不再采用白色前面板[32][33] - 发布15年的iPhone 4因在TikTok上被视为时尚怀旧象征而需求激增近1000%,但其运行的旧版iOS存在重大数字安全风险[48][49][50] - Instagram发生大规模数据泄露,近1750万用户的全名、电子邮件、电话号码及位置信息被泄露,但密码未被暴露[45] 企业战略与资本市场 - 半导体设备公司中微公司董事长尹志尧因从外籍恢复中国籍需办理税务事宜,计划减持不超过29万股公司股份,按股价计算市值约9764万元[28] - 拼多多为2026年春节加班设置阶梯式薪资补贴,除夕至初三期间报酬为当日工资3倍并含每日保底400元补贴,员工春节加班综合收入可达4900元至11000元以上[31] - 原小米高管王腾成立新公司“今日宜休”,已收到上百份简历,薪资对标大厂,公司初期重点组建产品研发团队,主要研发睡眠健康相关产品[37][38] - 移动电源品牌罗马仕遭供应商创益通起诉,一审被判支付拖欠货款1271.15万元及相应利息,此前亦曾被另一上市公司起诉追讨涉案金额1.36亿元的货款[40][41] - Anthropic正筹备以3500亿美元估值进行新一轮100亿美元融资,三个月前其估值为1830亿美元[54] 国际科技与监管 - 埃隆·马斯克宣布其社交媒体平台X将在七天内开源其核心推荐算法,并承诺每四周更新一次开源代码,此举被视为对监管压力的回应[43] - 因担心AI生成色情内容,印度尼西亚暂时封禁了马斯克旗下xAI的聊天机器人Grok,成为第一个拒绝访问该工具的国家[44] - 美国商务部撤销了一项旨在限制中国制造无人机进口的计划,而此前美国联邦通信委员会(FCC)已将大疆等列入“受管制清单”[36][37] - 印度拟出台安全措施要求智能手机制造商向政府共享源代码,引发苹果、三星等科技巨头私下反对[48] - 英伟达任命谷歌云业务资深高管Alison Wagonfeld出任公司首位首席营销官,以在AI需求高涨背景下系统化升级品牌与市场体系[53]
一直霸榜的pi0.5,被中国的模型干下来了!!!
具身智能之心· 2026-01-12 08:03
模型性能突破 - 千寻智能团队研发的Spirit v1.5模型在RoboChallenge评测榜上超越此前霸榜的Pi0.5,以66.09的总分和50.33%的成功率夺得总榜第一,而Pi0.5的分数和成功率分别为61.84和42.67% [2][4] - 这是中国具身智能模型首次在性能上超越海外最先进的开源模型,标志着中国在该领域进入全球领先阶段 [2] 传统数据方法的局限性 - 依赖高度“干净”的演示数据是模仿学习的弊病,其对应高昂成本,且存在多样性低和可扩展性受限的问题 [5] - 数据多样性低:采集过程遵循固定指令,导致数据缺乏多样性,例如“擦桌子”的数据集无法让模型学习处理打滑、杂乱表面或光线变化等现实复杂性 [5] - 可扩展性受限:每个新任务都需要精细的设计和质量控制,消耗大量工程资源,限制了数据采集的体量和模型可获得的机器人经验 [5] Spirit v1.5的核心技术特点 - 模型训练不依赖高度精选的“干净”演示数据,避免了因数据过于理想化而限制机器人在开放世界中的泛化能力 [6][7] - 在预训练阶段引入了开放式、多样化的数据采集范式,数据采集以“完成有意义目标”为导向,允许操作中自然串联多个子任务,使模型能接触到遮挡、失败恢复等真实世界复杂性 [8] - 这种基于多样化数据的预训练范式,代表了机器人学习领域摆脱对高度精选数据集依赖的根本性转变 [14] 多样化数据的训练优势 - 消融实验表明,在相同数据规模下,基于多样化数据预训练的模型在新任务上的迁移效率明显高于基于传统演示数据训练的模型,达到相同性能所需的计算资源显著减少 [9] - 多样化数据预训练的模型比干净数据训练的模型具有更快的收敛速度和更好的验证误差 [12] - 模型迁移效率随多样化数据量的增加呈正相关,数据规模扩大能持续降低模型在新任务上的验证误差,表明任务多样性比单任务演示数量更为关键 [13][16] - 使用高多样性、弱控制的数据进行预训练不仅可行,而且显著优于学术界常见的利用“干净”数据的做法 [13]