文章核心观点 - 公司于2月10日技术开放日发布了全球首个具身原生大模型DM0、具身原生开发框架Dexbotic 2.0以及具身原生应用量产工作流DFOL,旨在从底层重构具身智能产业 [1] - 公司认为2026年是“具身原生”的元年,而非“具身智能”的元年,主张从第一行代码开始即为机器人设计,而非改造现有大模型 [3] - 公司长期目标是成为一家机器人产品公司,通过“基础设施开源+核心模型自研+解决方案落地”的三层布局来实现 [37] 全球首个具身原生大模型 DM0 - DM0是全球首个从0开始训练的具身原生大模型,参数量为2.4B [3][10] - 模型设计核心准则是“具身原生”,强调必须考虑因果责任,因为与物理世界交互的后果比大模型产生幻觉更为严重 [3] - 模型训练数据策略是“环境的熵在哪,数据就采向哪”:对导航等规则清晰任务,大规模采集3D扫描场景进行仿真强化学习;对抓取等模糊任务,则依靠大量真机采集数据以提升泛化能力 [6][8] - 模型优势一:联合阶跃星辰训练,深度融合多模态互联网信息及驾驶、机器人操作等具身场景特有的多传感数据 [10] - 模型优势二:预训练阶段系统混合抓取、导航、全身控制3类核心任务,并覆盖8种差异显著的机型,获得强跨机型泛化与迁移能力 [12] - 模型实现了“小参数、高性能”突破,以2.4B参数量在RoboChallenge榜单获得单任务与多任务双项第一,位居全球榜首 [14] - 模型支持728x728高分辨率输入,解决了行业主流模型224-384分辨率在精细操作中易偏差的问题,实时推理延迟仅60ms [16] - 模型能在4090、5090等消费级显卡上进行二次开发,降低了使用门槛,且与真机强化学习高度适配,能提升复杂灵巧操作的完成率 [16] 具身原生开发框架 Dexbotic 2.0 - Dexbotic 2.0被定位为具身智能的“PyTorch”,旨在通过模块化、乐高式的方式降低开发门槛,让开发者快速搭建具身应用 [18] - 框架采用模块化架构,将系统拆分为Vision encoder、LLM、Action Expert三个可自由组合、独立升级的模块 [18] - 框架全面支持多源数据混合训练,让模型同步学会“看懂世界”和“动手操作” [20] - 核心优势包括构建了“Foundation + Evolution”两段式训练范式:先通过VLA预训练和微调学习通用操作,再通过强化学习针对复杂任务持续优化,以降低对标注数据的依赖并提升稳定性 [23] - 框架实现了统一具身操作与导航、统一模仿学习与强化学习,并标准化了从“数据—训练—评测—硬件”的全流程开发闭环 [24] - 公司联合清华大学、无问芯穹,并与强化学习框架RLinf达成战略合作,共同打造具身智能的基础设施 [26] - 目前Dexbotic已服务数十家机构,包括清华、北大、普林斯顿、帝国理工、腾讯等,覆盖超千位研发者 [27] 具身应用量产工作流 DFOL - DFOL旨在推动机器人走进工厂,实现规模化场景落地,其核心是通过“硬件通用+模型智能”的模式,兼顾效率、确定性与灵活性 [28] - 关键创新在于数据回流机制:现场产生的训练片段与负样本块实时回传云端,形成“云端训练-现场执行-数据回流-模型更新”的持续进化闭环 [30] - 该工作流有利于打破非标自动化与人工的边界,推动物理智能走向规模化和普惠化 [31] 商业化路径与场景选择 - 公司认为整个具身智能产业在2026年还无法实现商业化闭环,但2026年将是“真应用的涌现之年”,会有更多真实可用案例出现 [32] - 公司业务分为两块:一是为工业和物流领域提供端到端解决方案;二是提供科研产品,如数采机型,以开源理念促进行业发展 [32] - 首个落地突破口是多物料混合分拣,这是具身智能的真应用,客户需求明确;物流领域的打包、扫码等高度非标、依赖人工的环节也是重点布局方向 [35] - 商业化的核心是“给客户创造可衡量、可计算的价值”,即降本、增效或提升体验 [36] - 场景选择标准必须满足四个条件:错误容忍、时间容忍、泛化场景、长时间作业,当前技术尚不能做到100%成功,需客户允许犯错 [36] 公司战略与行业定位 - 公司长期目标是成为一家机器人产品公司,打造智能、有用、可信赖的机器人 [37] - 战略支撑是“基础设施开源+核心模型自研+解决方案落地”的三层布局 [37] - 在基础设施层面坚持开源策略,如RoboChallenge测试平台、Dexbotic2.0框架,以降低行业门槛并形成研发正向循环;但针对具体客户和任务的模型与数据不会开源 [37] - 公司认为基础设施是算法公司的核心竞争力,内部全链路基建大幅提升了模型迭代速度,对外输出基建旨在推动整个行业发展 [39] - 在机器人产品打造上,强调“有用”(创造可衡量价值)和“可信赖”(物理稳定性与心理安全感) [41]
模型、框架、应用量产工作流,原力灵机连掷"三枚炸弹"!具身智能"原生时刻"来了!
机器人大讲堂·2026-02-11 18:10