Workflow
Sim2Real
icon
搜索文档
清华团队开源DISCOVERSE框架:用3D高斯渲染打通机器人仿真到现实的“最后一公里”!
机器人大讲堂· 2025-11-10 12:07
端到端机器人学习当前面临的挑战 - 当前技术受制于仿真环境还原真实场景能力不足,导致仿真到现实迁移时性能显著下降 [1] - 场景资产获取和系统配置投入高昂,技术难以大规模铺开应用 [1] - 训练数据收集耗时久,拖慢整个学习进程,其中Sim2Real迁移性能下降是最核心障碍 [1] - 现有仿真环境与真实世界在物体外观质感、光线照射效果、空间几何结构等关键维度存在本质差异 [1] 现有仿真框架的局限性 - 目前尚无一套框架能同时满足视觉高度还原真实、物理交互精准无误、支持高效并行扩展三个要求 [3] - 部分框架视觉精美但物理层面与现实不一致,部分框架动力学模拟准但外观逼真度不足 [3] - 传统仿真器视觉保真度差,使用手工纹理贴图或简化光照效果,缺失真实世界复杂细节 [6] - 几何重建技术存在缺陷,遇到非朗伯表面或精细结构时容易出现表面塌陷,模型模糊或缺块 [6] - 兼容性和效率不可兼得,高性能仿真器配置复杂且不支持真实场景扫描资产,支持真实资产的方案渲染速度慢 [7] DISCOVERSE仿真框架的技术创新 - 首次将3D Gaussian Splatting渲染器、MuJoCo物理引擎和控制接口整合到统一架构,形成可扩展、模块化开源Real2Sim2Real框架 [5] - 设计分层级Real2Sim流水线,分别处理场景背景和交互物体,采用激光扫描+3D高斯splatting组合拳提升几何精度 [12][14] - 使用DiffusionLight模型生成HDR环境图,还原阳光灯光强度并模拟不同时间光影变化 [14] - 针对不同特性物体采用定制化方案,表面均匀反光物体用激光扫描,金属等非朗伯表面用3D生成模型CLAY [16] - 开发Mesh-Gaussian转换技术,完美打通网格模型和3D高斯格式壁垒,保留物理交互精度并发挥渲染优势 [17] DISCOVERSE的性能优势 - 渲染引擎采用瓦片式光栅化技术并做CUDA优化,实现高速并行渲染 [18] - 在Intel Xeon CPU和NVIDIA 6000 Ada GPU台式机上,5摄像头同时输出RGB-D帧可达650 FPS,比主流方案Issac Lab快3倍 [19] - 在笔记本电脑配置下也能跑到240 FPS,满足大规模并行训练需求 [20] - 集成MuJoCo物理引擎,精准模拟物体接触、摩擦、软约束等物理效应 [20] - 原生支持ROS2机器人操作系统,提供全套API,仿真控制逻辑可直接用于真实机器人 [20] DISCOVERSE的兼容性特点 - 支持3D高斯ply文件、网格模型obj/stl文件、物理仿真MJCF xml文件等主流格式 [21] - 支持从单机械臂到双臂人形移动操作器、轮式移动机器人和无人机等多种机器人模型 [21] - 传感器支持全面,包括RGB相机、深度相机、LiDAR激光雷达,力反馈传感器、IMU、触觉传感器等 [21] - 支持ACT、Diffusion Policy等主流模仿学习算法,内置数据增强工具 [22] DISCOVERSE的实测性能表现 - 在合笔记本电脑、推鼠标到垫上、捡奇异果三个真实操作任务测试中,零样本迁移成功率碾压同类方案 [22][24][26] - 使用ACT算法时平均成功率55%,比第二名SplatSim高11个百分点;加入图像增强后平均成功率飙升至86.5% [24][27] - 使用Diffusion Policy时平均成功率56%,比SplatSim高11个百分点;增强后达到86% [25][26] - 在捡奇异果高难度任务中,无增强时成功率48%是SplatSim1.8倍,增强后达到76%接近真实世界演示水平 [27] - 数据收集效率提升100倍,100条演示数据在真实世界需146分钟,在DISCOVERSE中仅需1.5分钟 [29] 行业应用与生态 - DISCOVERSE是通用机器人仿真框架,支持机器人、无人机、无人驾驶传感器等异构机器人本体验证测试 [30] - 框架已在官网放出代码和演示视频,提供完整Python API,面向个人开发者和企业开放 [30] - 文章列举了工业机器人、服务与特种机器人、医疗机器人、人形机器人、具身智能、核心零部件等领域的多家相关企业 [33][34][35][36][37][38]
Richtech Robotics Offers First Look at Dex: A Mobile Humanoid Robot for Real-World Work
Globenewswire· 2025-10-29 02:30
产品发布与合作 - 公司发布其首款用于工业领域的移动人形机器人Dex [1] - 公司与NVIDIA合作,利用NVIDIA Jetson Thor技术加速Dex在动态环境中的操作、实时推理和复杂任务执行,单次充电可运行整个工作日 [2] - 公司使用NVIDIA Isaac Sim仿真框架,通过“Sim2Real”流程缩短部署周期、提升安全性并加速新机器人应用的扩展 [3] 产品设计与性能 - Dex的设计基于全国超过450台机器人部署的经验,结合了Titan系列送货机器人的AMR技术和ADAM服务机器人系列的双臂精度 [4] - 公司出于工程和运营效率考虑,为Dex选择了轮式而非腿式平台,以实现快速制动、紧密机动性以及在人类共享环境中的稳定性,同时保持显著更低的能源和维护成本 [4] - Dex在移动模式下电池续航为4小时,并可从一个静态基座实现24/7连续运行,其双臂配备模块化末端执行器,并拥有四摄像头视觉系统以在快速变化的环境中导航和执行任务 [5] 市场定位与应用 - Dex能够处理广泛的轻中型工业任务,包括机器操作、零件分拣、物料搬运、质量检测和包装,使其成为制造业、物流及其他劳动密集型领域的即时生产力伙伴 [8][9][14] - 随着更多公司将制造业迁回美国,Dex为在不增加劳动力压力的情况下提高生产力提供了一条实用路径,可通过新数据训练并适应专业化工作流程 [6] - 公司启动了美国机器人数据计划,旨在通过投资国内培训和大规模数据收集来推动下一代物理AI的发展,并计划最终授权部分数据集以支持美国更广泛的物理AI公司 [7] 公司战略与展示 - 公司的战略支柱包括工业、商业和数据,致力于提供可靠的自动化、一致的服务性能以及大规模的持续AI驱动改进 [11] - Dex的 versatility 在GTC 2025上进行展示,机器人将现场演示使用工业机械组装棒球帽,以展示其灵巧性、移动性和AI智能 [9]
机械设备行业专题研究:机器人大脑是商业化焦点,Sim2real或成主流训练方案
国盛证券· 2025-10-26 17:06
行业投资评级 - 增持(维持)[4] 核心观点 - 机器人大脑是商业化焦点,Sim2real或成主流训练方案 [1] - 从LLM到VLA再到世界模型,人形机器人“大脑”发展迅猛,模型性能逐步提高 [1][9] - Tesla Optimus等海外模型拟人化程度高,国内研究机构在算法和数据集方面取得不错进展 [3] 机器人大脑模型技术演进 - LLM基于大规模文本数据训练的Transformer架构,解决了文本理解问题但无法处理图像 [9] - VLM跨模态融合突破文本限制,可同时识别图像和文本,由视觉编码器和语言模型组成 [12] - VLA模型跨越了图像/文本感知与机器人动作之间的鸿沟,RT-2是全球首个VLA模型,极大提升了泛化能力但数据收集成本较高 [1][17] - 模型输入端从视觉扩展到触觉,提升了鲁棒性 [1] - ViLLA框架采用无标注视频训练,解决了机器人动作不符合物理学的问题 [22] - 机器人模型终局形态或为世界模型,如Gemini Robotics 1.5系列已具备思维能力,可将AI世界带入物理世界 [26][28] 主流训练方案与发展 - Sim2Real或为未来主流训练方式,通过合成数据生成技术让机器人积累经验,使用虚拟数据为主、真实数据为辅 [2] - Sim2Real技术核心是串联AI超级计算机、仿真计算机(Omniverse和Isaac Sim)和物理AI计算机(GROOT、Cosmos、Jetson Thor)三台计算机 [2] - 银河通用发布的DexonomySim开源合成数据集即采用虚拟与真实数据合成 [2] 重点公司/机构模型分析 - Tesla Optimus的AI系统高度借鉴FSD技术,采用纯视觉方案和端到端单一神经网络,并与xAI的Grok模型深度融合,拟人化程度高 [29][30][33] - Tesla从模仿学习转向视频学习,下一步大模型架构方向或为世界模型 [36] - 北京通用人工智能研究院提出全球首个“力位混合控制算法”统一理论,无需使用传感器,相关任务成功率较仅使用位置控制策略提高约39.5% [3][58] - 银河通用发布全球首个灵巧手功能性抓取合成大数据集DexonomySim [3] - 智元启元大模型(GO-1)采用ViLLA架构,由VLM和MoE组成,可结合互联网视频和人类示范进行学习 [40] - Figure AI的Helix模型采用“系统1”(200Hz高速执行)与“系统2”(7-9Hz语义推理)双层解耦架构,可通过语言指定获取新技能 [46][48] - 宇树科技推出的UnifoLM-WMA-0是世界模型-动作架构,核心是理解机器人与环境交互物理规律的世界模型 [51]
黄仁勋女儿首秀直播:英伟达具身智能布局藏哪些关键信号?
机器人大讲堂· 2025-10-15 23:32
仿真与现实鸿沟(Sim2Real Gap)的挑战与重要性 - 机器人学习面临的核心问题是仿真与现实世界之间存在显著差距,具体体现在感知差距(如视觉、触觉信号差异)、物理交互差距(如物体受力反馈、形变偏差)以及场景复杂度差距(如难以复现真实世界的动态变化)[3][4] - 该鸿沟导致在仿真环境中训练的机器人程序难以直接适配并应用于真实场景[4] - 与主要依赖视觉的自动驾驶仿真相比,机器人领域的仿真挑战更大,因其涉及物理接触、操控,并需结合灵巧手和触觉传感器,问题复杂得多[9] 仿真与合成数据作为解决方案 - 现实中手动采集机器人数据成本高、效率低且存在安全风险,而仿真被认为是突破此数据困境的关键路径[7] - 由于机器人数量有限,难以像自动驾驶汽车那样大规模采集现实数据,因此必须使用合成数据,并坚信合成数据将是解决物理AI数据壁垒最重要、最主要的数据来源[9] - 通过仿真可生成上千种模型并设置不同物理参数,使机器人在几天内完成相当于现实几年的训练量,例如训练机器人叠衣服[12] - 生成式AI技术(如3D计算机视觉、视频生成、3D世界生成)有望提升仿真真实感,优化视觉渲染和物体细节,减少感知差距[6] 英伟达的“三台计算机”战略布局 - 公司致力于打造机器人可学习的“虚拟地球”,其技术体系可通过“三台计算机”的逻辑理解,Sim2Real是串联三者的核心纽带[10] - **AI超级计算机**:是让机器学会处理信息的基础,为机器人核心程序提供算力支撑[10] - **仿真计算机**:以Omniverse和Isaac Sim为核心,让机器在虚拟世界中掌握感知与交互能力,其关键难点在于物理交互,例如电缆、电线仿真是亟待突破的“圣杯级”难题[11] - **物理AI计算机**:由GROOT(通用机器人基础程序)、Cosmos(世界模型)和Jetson Thor(机器人端侧芯片)构成,负责让机器人在真实世界中执行任务,其中Cosmos是衔接仿真与现实的关键环节,能像数据放大器一样生成更多样、更贴近真实情况的数据[11][12] 英伟达与光轮智能的合作关系 - 光轮智能与公司的Sim2Real技术路线高度契合,双方已形成技术共生关系,光轮智能是少数能在物理精度、交互逻辑、场景多样性上全面匹配公司物理智能生态需求的合作方[12] - 公司正重点推进物理AI(含机器人、自动驾驶、数字孪生)的技术落地,核心痛点是缺乏海量真实、多样化的物理交互数据,需要能稳定输出高质量数据的“合成数据工厂”以及愿景一致的合作伙伴,而光轮智能成立的时机恰好满足此需求[15] - 双方对SimReady资产有共识,认为其不仅是数字3D模型,还必须具备真实的物理属性(如冰箱铰链的阻尼、微波炉材质的摩擦系数),光轮智能的核心工作是通过专业设备采集真实物理数据并植入SimReady资产,确保物理属性匹配[16] 英伟达物理智能的全链路体系 - 公司正构建物理智能全链路体系,包括OpenUSD(3D数据标准)、SimReady(仿真资产标准)、Newton(物理计算)、Cosmos(世界模型)[16] - Sim2Real的关键不是让虚拟复制现实,而是通过场景随机化、参数调整让虚拟覆盖现实,使机器人在虚拟中接触足够多的意外情况,从而能在现实中应对自如[12] - 与斯坦福合作的“OmniGibson”仿真引擎已能支持刚体物理、可变形物体(布料、流体)交互,以及物体的加热、切割等复杂状态模拟[6]
直播预告:光轮智能 × NVIDIA带来Sim2Real关键突破
量子位· 2025-10-08 21:06
直播活动概述 - 光轮智能与NVIDIA将联合举办一场重磅直播活动 [1] - 直播将揭秘如何利用SimReady与AI技术打通Sim2Real(仿真到现实) [1] 核心技术焦点 - 直播将深度解析双方如何基于SimReady与AI实现从虚拟仿真到物理世界的无缝迁移 [2] - 该技术旨在攻克机器人开发落地过程中的关键挑战 [2] 合作与进展 - 直播将独家披露光轮智能与NVIDIA在技术研发和场景应用方面的最新合作成果与未来规划 [3] 行业洞察与分享 - 两位专家将结合实践经验分享机器人及AI领域的技术趋势 [4] - 直播内容将涵盖该领域的商业化路径探讨 [4] 主讲嘉宾与时间 - 主讲嘉宾包括光轮智能创始人兼CEO Steve Xie和NVIDIA产品营销高级总监Madison Huang [6] - 直播时间为北京时间10月9日凌晨0:00(太平洋时间10月8日上午9:00) [6]
Sim2Real,解不了具身智能的数据困境。
自动驾驶之心· 2025-10-03 11:32
核心观点 - 具身智能领域正面临仿真数据、真实数据与世界模型三种技术路线的选择与融合,行业专家普遍认为仿真数据在当前及可预见的未来具有不可替代的作用,尤其是在模型训练、测试和安全验证方面,而世界模型作为新兴方向,在长期规划和数据生成方面展现出潜力,但其发展仍受限于奖励机制设计、计算资源等因素 [4][19][27] 对Sim-to-Real Gap的理解 - Sim-to-Real Gap的核心在于仿真环境对真实世界模拟不完全,存在视觉细节(如物体摩擦力、光影效果)和物理细节还原不足的问题,导致模型泛化能力弱、仅适配特定场景 [8] - 缩小差距需围绕数据优化展开,包括结合模型需求设计虚拟与真实数据配比、借助AIGC生成丰富数据以兼顾体量与真实性等 [8] - 以阴影问题为例,不同光源位置会形成不同阴影,可作为判断模型对真实世界理解程度的有效依据 [8] - 解决数据问题的一种方案是借助AIGC强大的生成能力,通过替换桌面纹理、光照、物体摆放等方式,兼顾数据丰富性与真实性 [11] 仿真数据与真实数据的价值与应用 - 在自动驾驶等领域,仿真测试已被验证更快速、省时省力且安全,训练用真机更务实,测试用仿真更合适是核心观点之一 [19] - 从学术角度看,若真机数据能极大丰富,同等数量下其训练效果优于仿真数据,但现实是具身智能领域真实数据体量远不及自动驾驶,且机器人本体不易统一,行业期待高,导致真实数据缺口巨大 [20] - 仿真数据在当前阶段的关键作用在于基础模型迭代和测试,没有机构会训完模型不做仿真测试就直接上真机,可避免真机实验中烧电机、损坏关节等难以估量的损失 [21] - 仿真在强化学习规模化上价值更大,若仿真器构建良好,可通过大规模并行训练让模型学习到真实数据中难获取的场景(如物体被碰倒后如何处理) [24] - 仿真数据的核心优势包括代码复用性强(更换机器人时仿真代码基本无需改动)以及在教育领域的显著价值,能降低授课与学习门槛 [26] - 长期来看,仿真数据是更有效的解决方案,只有在仿真无法满足需求时才考虑使用真实数据进行补充 [26] 世界模型的未来研究方向与价值 - 世界模型应用于自动驾驶、具身智能的方向正确,但存在核心问题待解决,如“小世界模型”路径是否可行(即能否基于其直接生成轨迹或策略),以及奖励设计与下游任务衔接问题 [29] - 世界模型并非新概念,与过往相关模型概念相通,该领域研究无需大量计算资源,学术界应聚焦用小资源就能探索的学术问题 [29] - 引入力、触觉等新模态是值得关注的研究方向,可聚焦世界模型中物理规律的相关问题,在有限计算资源下开展尝试 [30] - 在未来12-18个月内,最重要的科学问题是如何在世界模型中引入reward,因为action和observation已有较好发展,而操作领域仍处于混沌状态,适合科研探索 [31] - Genie 3虽能渲染视频且三维一致性较好,但在面向机器人等场景时,当前动作维度(如六维、七维)不足,仍需数据引擎构建对应场景来生成高维度动作数据 [32] - 世界模型的研究对于通用视觉、长期规划和记忆功能等方面展现出潜力,但如何设计合适的奖励机制以及如何应用于更多场景是关键待解问题 [32] 对波士顿动力机器人技术的分析 - 波士顿动力机器人的技术实力体现在其执行任务的“丝滑”性,这不仅涉及单纯的抓取操作,还涉及全身运动,其遥操作部分技术难度很高,需要出色的运动控制作为支撑 [33][35] - 该系统的模型设计若不复杂,但结合出色的底层能力实现了好效果,比设计复杂模型更令人震惊,目前在遥操作素材采集上就落后于该系统 [35] - 具身智能领域的关键不在于算法,而在于数据和硬件,波士顿动力的硬件技术方案与教育界常用方案差异显著,其高度拟人化设计代表了正确发展方向,但核心问题在于其硬件产品并不对外出售 [37] - 实现丝滑效果的另一关键因素是推理层面的架构经过大量调整优化,“避免阻塞”这一问题即便有专门研究,开源方案仍有很大改进空间 [37] - 运动控制(运控)水平的差异是表现差异的重要原因,传统控制的相关技术值得被结合、借鉴到现代具身智能中,以提升机器人动作的流畅性 [38][39]
自搜索强化学习SSRL:Agentic RL的Sim2Real时刻
机器之心· 2025-09-02 09:27
研究背景与方法 - 研究由清华大学、上海人工智能实验室、上海交通大学等机构联合完成,聚焦于利用大语言模型内部世界知识提升搜索智能体训练效率 [2][6] - 提出SSRL方法,通过结构化提示和格式奖励有效提取模型世界知识,降低幻觉并在多个基准测试中取得更好效果 [2][6][8] - 探索训练智能体无需真实环境参与的可能性,并验证接入真实搜索引擎后SSRL训练的模型表现更优,体现Sim2Real有效性 [2][8] 当前搜索智能体训练挑战 - 全真实搜索方式直接调用商业搜索引擎API或RAG本地知识库,成本高昂且与真实场景存在差距 [7][13] - 半真实搜索使用辅助LLM模拟搜索引擎行为,但训练效率低下且不稳定 [7][13] - 当前训练方式非常昂贵、耗时且不稳定,多轮工具调用导致rollout效率降低,外部信息引入易导致模型崩溃 [7][13] LLM利用世界知识的上限 - 通过formatted instruction显式利用模型内部知识,在大量模型上采样显示仅依赖内部知识即可在所有基准测试中获得明显效果提升 [10][12] - Llama-3.1-8B-Instruct在Bamboogle上pass@64达到76%正确率,在BrowseComp上pass@256达到10%正确率 [12] - 发现Llama系列在该类任务上效果远超Qwen系列,与数学领域结论相反 [12] - Majority Voting方法无法逼近模型能力上限,增加采样数量时效果不会进一步提升 [15] SSRL训练优化与设计 - 训练目标函数优化为标准GRPO目标,通过信息掩码强制模型基于查询和推理生成答案而非简单复制 [22][23] - 采用复合奖励函数结合格式奖励和结果奖励,防止奖励黑客并确保奖励有效性 [24] - 训练后模型表现优于依赖外部引擎训练的模型,训练效率提升约5.6倍且训练奖励持续增长未出现崩溃现象 [31] 实验结果 - 在Llama和Qwen2.5系列模型上训练,SSRL方法在多项基准测试中取得更好效果 [25][26] - Llama-3.2-3B-Instruct模型在HotpotQA上达到43.8%准确率,在NQ上达到58.4%,在Bamboogle上达到38.4% [26] - Llama-3.1-8B-Instruct模型在HotpotQA上达到48.0%准确率,在NQ上达到62.6%,在Bamboogle上达到54.4% [26] Sim2Real泛化 - 将前K个自搜索知识替换为在线搜索结果,发现SSRL训练模型在真实场景下表现更优 [28][29] - Llama-3.2-3B-Instruct模型在Sim2Real设置下准确率提升至41.9%,Qwen2.5-7B-Instruct提升至47.9% [33] - 随着K增加效果不会持续增长,显示模型内部知识具有高度压缩性和灵活性 [32] 熵引导搜索 - 提出熵引导搜索方法,根据模型不确定性动态选择使用内部知识或外部工具 [34] - 搜索次数减少20%-42%的同时保持可比性能,Llama-3.1-8B-Instruct模型准确率提升至41.7% [36] SSRL与TTRL结合 - SSRL与TTRL结合可获得显著效果提升,Llama-3.2-3B-Instruct模型在多项测试中准确率提升最高达67% [38][39] - 在BrowseComp任务上,Llama-3.2-3B-Instruct模型达到6.2%准确率 [40] - 但TTRL易导致模型过于自信和训练崩溃问题 [39]
数据困局下的具身智能,谁能率先破局?
机器之心· 2025-08-10 09:30
数据困局下的具身智能 - 具身智能面临真实数据严重不足的挑战,目前多数机器人基础模型仅依赖不足1%的真实操作数据,导致物理常识缺失和泛化能力受限[5] - 行业对数据类型选择存在分歧:真实数据能反映物理交互但采集成本高,合成数据成本低且易扩展但存在"domain gap"问题[6][7] - 真实数据派代表Levine指出,模型能力提升会放大仿真与现实的差异,削弱泛化能力,认为只有真实数据才能实现通用具身智能[7] - 合成数据派代表王鹤提出需要上万亿token规模数据,但当前最大数据集仅百万级别,认为具身智能爆发必须依赖合成数据先行[8] - 合成数据应用案例:GraspVLA模型通过十亿级合成数据预训练+少量真实数据微调,已在零售、导航场景实现商业部署[8] 技术路线之争 - 遥操作成为真实数据主要采集方式,依赖人类示范支持模仿学习,但面临控制效率与扩展能力的平衡问题[9] - Sim2Real技术路径依赖合成仿真数据,优势在于可控性强、成本低,适合大规模预训练与策略泛化[9] - 多模态遥操作系统探索语言+手势+触觉融合,可能降低人类操控门槛[1] 商业模式创新 - OpenAI董事会主席Bret Taylor批判"按token计费"模式,认为市场终将选择"按成果付费"[2] - 提出"应用AI"是创业方向,"长尾Agent公司"可能取代传统SaaS[2] - Sierra公司正在实践结果导向的商业模式,探索AI编程新范式[2] 行业动态 - Skild AI最新进展聚焦解决真实数据不足问题,倡导融合多样化数据尤其是大规模视频数据[5] - 本期通讯包含30项AI&Robotics要事,其中国内8项、国外9项、技术13项[2]
科协年会助力青年人才挑大梁
科技日报· 2025-08-03 11:43
年会概况 - 第二十七届中国科协年会于7月1日至31日在北京举办,主题为"示踪科技前沿 助力创新发展",涵盖主论坛、专题论坛等6个版块百余项活动 [1] - 年会吸引7000余人次科技工作者参与,包括110余人次院士,其中40岁以下青年科技工作者占比57% [1] - 年会共开展990余个高水平学术报告 [1] 青年科技工作者参与 - 青年科技工作者深度参与并主导前沿讨论是本届年会亮点 [2] - 北京交通大学副教授张慧在"具身智能机器人"论坛中受到启发,将具身学习思想融入自身研究 [3] - 青年学者在会上直接向院士、专家提问,自由讨论氛围打破思维定式 [4] 学术交流机制 - 年会优化研讨机制,增加交流时长,聚焦非共识议题 [4] - 核工业西南物理研究院副研究员肖国梁参与核聚变论坛,跨领域讨论打破学识与年龄层级限制 [4] - 中国电机工程学会副秘书长申彦红表示年会鼓励科研不确定性和非共识观点,营造包容开放的学术环境 [4]
顶尖科学家带队,国内头部具身智能机器人企业完成数亿元新一轮融资!
Robot猎场备忘录· 2025-07-20 13:01
融资情况 - 跨维智能于2025年7月10日完成数亿元A1、A2轮系列融资,由成都科创投、洪泰基金领投,天鹰资本、四川院士基金、南山战新投、一村资本、探元创投等跟投,老股东联想创投持续加码[1] - 2025年1月16日完成Pre-A+轮融资,投资方为汇芯投资,金额未披露[1][2] - 公司累计完成8轮融资(含股权转让),包括2022年亿元级天使轮和Pre-A轮融资,2024年完成两轮融资[2] - 松禾资本为团队外第一大股东,持股9.7512%,天鹰资本持股5.1724%[2] 公司定位与技术 - 公司成立于2021年6月,最初定位为三维视觉软硬件研发企业,后转型为以Sim2Real为核心的具身智能技术企业[4][5] - 研发人员占比超70%,团队由全球Top2%顶尖科学家贾奎教授领衔[7] - 核心技术包括DexVerse™具身智能引擎,实现"三维数字资产生成-数据合成-物理仿真-模型训练-部署"全链条自动化[12] - 产品矩阵涵盖具身智能大脑(X-Wiz)、传感器及通用机器人,多模态感知系统支持毫秒级环境解析[13][14] 核心产品 - 2025年1月发布人形机器人DexForce W1,业内首款基于Sim2Real引擎定义的产品,身高170cm,双臂负载20kg,续航8小时[8][11] - W1配备34个动力单元(控制频率1000次/秒)、7自由度机械臂(单臂负载10kg)、6自由度灵巧手(力控精度20mA)[11] - 搭载DexVerse引擎实现虚拟仿真到真实世界的快速部署,纯视觉传感器支持复杂光照环境识别[11] 商业化进展 - 工业领域已实现100%合成数据驱动,毫米级操作精度下任务成功率超99.9%[16] - 覆盖汽车、新能源、3C电子等50+行业,服务头部车厂、电池厂商等客户,年营收达亿元级[16] - 累计开发上百家客户,落地数十场景,自称"具身智能工业场景落地第一名"[16] 行业竞争格局 - 国内人形机器人企业分"硬件派"(如宇树科技)和"软件派"(如智元机器人、银河通用),跨维智能属后者[17] - 具备AI能力且涉及本体的初创公司受资本青睐,2025年多家完成大额融资(如银河通用估值150亿)[17] - 行业共识认为自研机器人大模型是商业化核心壁垒,需构建技术闭环掌握主动权[18] 行业挑战 - 商业化场景多数处于POC阶段,实际价值待验证,技术壁垒存疑[19] - 硬件派面临"祛魅",软件派短期难落地,特斯拉Optimus砍单事件影响行业信心[19] - 量产与有效场景应用是主要难点,行业长周期特性显著[19]