核心观点 - 优必选科技开源其具身智能大模型Thinker的架构升级版,该模型以不到10B的小参数规模,在9项核心权威基准评测中取得全球第一,实现了“小参数、高性能、全开源” [2][3] - 此次开源不仅是模型发布,更标志着行业对“智能”的评判标准从实验室演示和语言交互,转向在真实工业环境中稳定、精准执行任务的能力 [5][9] - 公司通过构建以数据为中心的工业化训练体系、极致效能的轻量架构以及数据回流闭环,打造了适用于工业场景的通用技术底座,旨在加速整个具身智能产业的落地进程 [10][19][20] 性能表现与行业标准 - Thinker模型在涵盖规划、视觉定位、3D空间理解和多模态理解等9项权威基准评测中均排名全球第一 [3][4] - 在规划任务中,Thinker-4B在RoboVQA BLEU和Ego-Plan2基准上分别取得62.66和63.66的分数,达到SOTA水平并大幅领先 [7][8] - 在视觉定位任务中,Thinker-4B在Where2Place和Pixmo-Point基准上分别取得72.03和57.41的分数,全面超越7B/8B梯队模型 [8] - 在3D空间理解任务中,Thinker-4B在BLINK、CV-Bench、EmbSpatial、RoboSpatial等多个基准上全线领先,展现出断层优势 [8] - 在多模态理解任务中,Thinker-4B在RealWorldQA、MME、MMMU_VAL基准上分别取得71.89、2323.4和46.22的分数,以4B体量实现了8B级别的通用认知水平 [4][8] 技术架构与核心突破 - 突破一:数据炼金术:面对20B规模的原始数据,通过自动化精炼提纯流水线,最终淬炼出约10M级别的高价值黄金数据集,并配合L4级精细标注标准,系统强化了高质量数据供给 [11] - 突破二:极致效能架构:模型死磕10B以下的小参数架构,目标为实现实时响应;创新采用“视频+关键帧”联合输入,强化对动作末尾关键信息的捕捉,确保操作精准闭环 [14] - 突破三:转动数据飞轮:创新性打通数据回流机制,当机器人在工厂遇到失败案例时,系统会自动捕获异常并反向注入训练集;通过大模型辅助标注与多模型交叉验证,将人工参与率降至1%以下,成本直降99% [15] 工业应用与价值 - Thinker模型已搭载于Walker S2机器人并走进真实工厂,其目标明确为在杂乱的工厂环境里精准稳定作业,而非实验室表演 [5][9] - 得益于Thinker的精准调度,Walker S2在搬运、分拣等实战场景中实现了99.99%的作业准确率 [16] - 模型轻量化的架构让部署成本更低,能直接在Walker S2本体算力上实现毫秒级响应,满足工业产线对实时性的严苛要求 [14] 开源战略与产业影响 - 优必选将Thinker模型全栈开源,核心是为行业提供一个经过工业验证的通用技术底座,推动技术研发从虚拟演示回归务实执行 [19] - 开源旨在解决具身智能领域评测标准不一、实验室性能与工业场景需求脱节的问题,为全球开发者提供基于真实物理世界的标尺 [19] - 面对医疗、能源、物流等碎片化场景,经过工业验证的Thinker通用基座让开发者与企业无需从零开始,可大幅缩短机器人从技术到产品的落地周期 [19] - 通过开源,公司正将中国的制造业场景优势转化为参与定义全球技术生态的主动权,并以开放协作方式为整个领域预留持续迭代与进化的技术空间 [19][20]
凭什么拿9榜第一?拆解优必选开源具身智能大模型Thinker的实干逻辑
机器人大讲堂·2026-02-08 12:06