Workflow
具身原生
icon
搜索文档
对话原力灵机周而进:模型2.4B就够用,关键是“具身原生”;能闭环才是最高效方法
量子位· 2026-02-13 13:42
公司及产品发布 - 具身智能创企原力灵机推出了其首个具身原生大模型产品DM0,参数量仅为24亿(2.4B)[5] - 同时发布的还有开源具身原生框架Dexbotic 2.0,以及解锁具身应用量产的工作流DFOL,共同构成“具身软件三件套”[8] - 在RoboChallenge大规模真机评测中,DM0取得了单任务和多任务双料第一,综合得分72.25,成功率为62.00%[31][32] 技术路线与核心特点 - 公司追求“具身原生”路线,强调从数据采集、推理到控制都应源自物理世界反馈,而非数字世界的派生模态[21] - DM0模型从底层将感知、推理、控制整合为闭环,并通过空间推理思维链内生出具身智能[23] - 模型训练从零开始,融合了互联网、智能驾驶和具身多传感数据,旨在让模型从初始阶段就理解物理世界[27][28][40][42] - 模型采用多源、多任务、多机型训练,目前使用了8种不同本体的机器人数据,以学习通用操作逻辑而非特定机器参数[25][55][56] - 模型能够实时处理三视角的728x728画面,推理延迟仅60毫秒,并可通过强化学习在真机上试错进化[4] 数据策略 - 训练数据主要来自三个来源:互联网数据、智能辅助驾驶数据和具身智能数据,三者角色不同,混合比例根据实验动态调整[62][66][68] - 数据采集遵循“全身全时全域”原则:“全身”指包含底盘移动、躯干协调及所有传感器反馈;“全时”强调记录从意图产生到动作执行及修正的连续因果链;“全域”是未来在空间场景覆盖上的规划[82][83][85][88] - 数据采集策略是“熵在哪里,数据就投向哪里”,针对模型表现不佳的高不确定性任务进行针对性数据补充,实现以需定采的反馈闭环[72][75][76] - 在物理规则确定的低熵场景,通过算力生成仿真数据;在物理或语义模糊的高熵场景,则依赖真机采集真实交互数据[78][79][80] 模型能力与效果 - DM0的核心设计引入了空间推理思维链,这是一种三维物理世界的推演能力,能将视觉特征转化为精确的空间坐标和轨迹,以应对如“收拾桌面”等模糊指令[104][105][106][107] - 结合高分辨率输入,空间推理思维链能让模型处理毫米级精度的任务,识别并执行微小的位置差异[112][113] - 模型设计中借鉴了世界模型的范式,将其视为一种模型内的世界理解方式,用于在不执行动作的前提下推理动作后果,以支持决策和规划[158][159][162] 应用场景与商业化 - 公司选择物流场景作为首要落地切入点,因其场景明确、具备高度可复制性,且能带来规模化数据回流[125][147][150] - 在物流场景中,公司专注于物料分拣等任务,其复杂性体现在需要处理柔性/刚性混杂、随意摆放的物体,并实现精细操作[127] - 公司认为精细动作是真正的挑战,其前提是精细感知,因此模型设计非常看重高分辨率输入下的稳定性[131][135][136] - 公司的商业化路线图是:从物流场景开始,先做专项能力产品进入仓储环境,然后逐步推向ToB靠近ToC的场景(如门店导购),最终在技术、成本、安全性成熟后走向家庭场景[154][155][156] 团队背景 - 公司核心团队由前旷视成员组成,包括合伙人周而进(负责大模型)、范浩强、汪天才,以及担任CEO的前旷视联合创始人唐文斌[16][17][177] - 周而进是信息学竞赛金牌选手,拥有深厚的AI背景,早在2013年就以实习生身份在ICCV比赛中获得冠军[12][14] 行业观点与公司理念 - 公司认为当前行业主流方案是“VLM+Action Head”思路,即大模型负责识别推理,动作头负责执行[18][19] - 公司强调机器人必须尽早实现7×24小时真实环境运行,只有这样才能暴露工程问题、获得真实数据回流,形成数据飞轮[115][116][117][121] - 公司对具身智能的终极展望是机器人能够拥有广泛的社会身份,例如具备独立的支付和结算能力,成为社会化的接口[168][170][172]
发布全球首个具身原生大模型DM0,原力灵机唐文斌:今年将是「具身原生」元年
IPO早知道· 2026-02-11 13:31
公司技术理念与战略定位 - 公司提出“具身原生”新AI范式 其核心理念是智能本质和形成机制根植于物理交互 旨在驱动具身智能范式跃迁[3] - 公司认为2026年是“具身原生”的元年 而非具身智能的元年[3] - 公司技术路径是通过底层原生技术创新降低开发门槛 通过开源开放凝聚生态力量 最终推动具身智能从炫酷演示走向普惠的规模化生产力[7] 核心产品:具身原生大模型DM0 - 公司发布全球首个从零开始训练的具身原生大模型DM0 其具备“多源数据预训练”、“多任务、跨机型预训练”与“空间推理思维链”三大核心特征[4] - DM0的2.4B参数版本在权威真机评测基准RoboChallenge上 夺得单任务与多任务双项第一 目前位列全球榜首[4] - DM0在预训练阶段系统混合了操作、导航、全身控制三类核心任务 并覆盖了8种构型迥异的机器人硬件 从而获得了强大的跨机型泛化能力[6] - DM0通过构建“空间推理思维链” 将环境感知、任务理解、运动规划与精细执行串联成闭环 使机器人能完成需要多步骤空间推理的广义动作[6] - 公司宣布DM0的2.4B版本全面开源 代码、模型及RoboChallenge全部30个任务的参数与推理代码均已开放[6] 配套开发框架与工作流 - 公司发布全球首个具身原生开发框架Dexbotic 2.0 其采用模块化架构 将视觉编码器、大语言模型、动作专家三大模块解耦 允许开发者在感知、认知、控制层面独立升级或替换组件[6] - 公司发布面向量产的具身原生工作流DFOL 其核心是通过“硬件通用 + 模型智能”的模式 破解效率与灵活性难以兼得的产业困境[6]
雷军宣布初代小米SU7停产;传百度秘密启动“O计划”
21世纪经济报道· 2026-02-11 10:26
巨头风向标 - 小米汽车宣布第一代SU7正式停产,累计交付量接近**37万辆**,公司目前暂无进入美国市场的计划 [2] - 百度据传秘密启动与百度APP相关的“O计划”,其文心助手月活用户数已突破**2亿**,并以**5亿**红包入局春节AI营销 [3] - 智谱股价连续两日强势领涨,盘中一度高见**344港元**,较其**116.2港元**的发行价累计涨幅近**200%**,市场猜测其或将发布新一代大模型GLM-5 [4] - 字节跳动对视频生成模型Seedance2.0进行紧急优化,内测期间暂不支持输入真人图片或视频作为主体参考 [5] - 追觅科技创始人俞浩在社交媒体公开邀请华为余承东加入其公司 [6] - 阿里巴巴推出新一代图像生成基础模型Qwen-Image-2.0,开发者可通过API邀测或QwenChat免费体验 [7] - 字节跳动上线图像生成模型Seedream5.0 Preview,在旗下多款应用开启灰度测试或限时免费体验 [8][9] - 支付宝全新上线Robotaxi打车小程序,聚合小马智行等服务商,运营区域已覆盖广州、东莞、北京、武汉、深圳五个城市的部分地区 [10] 最芯见闻 - 本田汽车公布第三季度经营利润为**1533.6亿日元**,净利润为**1536.1亿日元**,销售净额为**5.34万亿日元**,均超预期,并已制定方案以防芯片供应短缺问题再次发生 [11] - 摩尔线程开源TileLang-MUSA项目,旨在降低开发门槛,为国产算力平台提供更高效的AI与高性能计算开发体验 [12] 上市资本流 - 具身智能企业“穹彻智能”完成**数亿元**A轮融资,由C资本领投,融资将用于大模型研发迭代及发布智慧药房解决方案 [13] - 机器人公司“大晓机器人”完成天使轮融资,由蚂蚁集团领投,商汤国香资本等老股东持续增资 [14] 潮新品 - 原力灵机发布全球首个具身原生大模型DM0(**2.4B**参数)、原生开发框架Dexbotic 2.0及具身原生应用量产工作流DFOL [15] - 腾讯混元开源面向消费级硬件的“极小”模型HY-1.8B-2Bit,通过2Bit量化技术,等效参数量约为**0.3B**,实际存储占用仅约**600MB** [16]
原力灵机发布具身原生三大成果:模型、框架和应用量产工作流
新浪财经· 2026-02-10 17:48
公司战略与产品发布 - 原力灵机发布三大核心产品:首个具身原生大模型 DM0、具身原生开发框架 Dexbotic 2.0、以及具身原生应用量产工作流 DFOL [1] - 公司提出“具身原生”新概念,认为2026年是具身原生元年,主张AI应从第一行代码开始就为机器人而写,而非改造现有大模型 [1] - 公司旨在通过技术底座和基础设施降低开发门槛,并推动机器人走进工厂,实现具身智能的规模化场景落地 [4] 具身原生大模型 DM0 - DM0是全球首个具身原生大模型,其智能本质和形成机制根植于物理交互,旨在复杂环境中精准完成人类任务 [3] - 该模型是从0开始训练的具身原生大模型,由原力灵机与阶跃星辰联合训练,数据融合了多模态互联网信息及驾驶行为、机器人操作、导航等具身场景特有的多传感数据 [3] - DM0在预训练阶段系统混合了抓取、导航、全身控制三类核心任务,并覆盖UR、Franka等8种差异显著的机型,从而获得强大的跨机型泛化与迁移能力 [3] 具身原生开发框架 Dexbotic 2.0 - Dexbotic 2.0是首个具身原生开发框架,旨在像PyTorch一样,让开发者能以乐高式的方式快速搭建具身应用 [3] - 相比1.0版本,Dexbotic 2.0实现了全面升级,具备模块化架构优势,将系统拆分为V(视觉编码器)、L(大语言模型)、A(动作专家)三个可自由组合、独立升级的模块,便于快速试验新模型并适配不同硬件和任务场景 [3] - 该框架实现了统一具身操作与导航、统一模仿学习与强化学习,并标准化了从“数据—训练—评测—硬件”的全流程开发闭环 [4] - 目前Dexbotic 2.0已服务数十家机构,包括清华、北大、普林斯顿、帝国理工、腾讯等,覆盖超过千位研发者 [4] - 原力灵机联合清华大学、无问芯穹,并宣布与强化学习框架RLinf达成战略合作,共同打造具身智能的PyTorch,以降低开发门槛 [4] 具身应用量产工作流 DFOL - DFOL(分布式现场在线学习)工作流的核心是通过“硬件通用+模型智能”模式,使机器人在保持高效率与确定性的同时,兼具灵活性和适应性 [4] - DFOL的关键创新在于数据回流机制:现场产生的训练片段与负样本块实时回传云端,形成“云端训练-现场执行-数据回流-模型更新”的持续进化闭环,使系统能在真实工作环境中不断自我改进 [5]
「具身原生」元年!专访原力灵机汪天才,解析具身智能的「PyTorch时刻」
机器之心· 2026-02-10 16:52
编辑|Panda 在数字世界里,AI 智能体正通过 MoltBook 这样社交网络进行语义协商并协同进化,而在物理世界中,具身智能也迎来了一次里程碑式的进展。 在原力灵机的实验室里,一台由 Hugging Face 开源的、3D 打印出来的 SO-101 机器臂正灵巧地将外形各异的物品放入指定的盒子中。这个动作看似简单,实则包 含了极高频的视觉反馈、力度感知以及对复杂物理环境的 直觉 判断。 实际上,这种从「计算」到「直觉」的跨越,并非源于针对这个特定硬件的繁琐调优,而是受益于一套标准化的底层基建。 在 2 月 10 日的技术开发日上,原力灵机正式发布了 开源具 身原 生框架 Dexbotic 2.0,并宣布了其与清华大学和无问芯穹支持的强化学习框架 RLinf 的战略合作 原力灵机合伙人汪天才将 Dexbotic 2.0 与 RLinf 的深度结合定义为 具身智能行业的「PyTorch 时刻」 。正如 PyTorch 通过标准化的张量计算与自动微分机制释放了 深度学习的生产力,Dexbotic 2.0 与 RLinf 的联手试图在具身智能这个碎片化严重的赛道上,建立一套通用的底座和基础设施。 伴随这一框架升 ...