Workflow
Sim2Real
icon
搜索文档
数据困局下的具身智能,谁能率先破局?
机器之心· 2025-08-10 09:30
数据困局下的具身智能 - 具身智能面临真实数据严重不足的挑战,目前多数机器人基础模型仅依赖不足1%的真实操作数据,导致物理常识缺失和泛化能力受限[5] - 行业对数据类型选择存在分歧:真实数据能反映物理交互但采集成本高,合成数据成本低且易扩展但存在"domain gap"问题[6][7] - 真实数据派代表Levine指出,模型能力提升会放大仿真与现实的差异,削弱泛化能力,认为只有真实数据才能实现通用具身智能[7] - 合成数据派代表王鹤提出需要上万亿token规模数据,但当前最大数据集仅百万级别,认为具身智能爆发必须依赖合成数据先行[8] - 合成数据应用案例:GraspVLA模型通过十亿级合成数据预训练+少量真实数据微调,已在零售、导航场景实现商业部署[8] 技术路线之争 - 遥操作成为真实数据主要采集方式,依赖人类示范支持模仿学习,但面临控制效率与扩展能力的平衡问题[9] - Sim2Real技术路径依赖合成仿真数据,优势在于可控性强、成本低,适合大规模预训练与策略泛化[9] - 多模态遥操作系统探索语言+手势+触觉融合,可能降低人类操控门槛[1] 商业模式创新 - OpenAI董事会主席Bret Taylor批判"按token计费"模式,认为市场终将选择"按成果付费"[2] - 提出"应用AI"是创业方向,"长尾Agent公司"可能取代传统SaaS[2] - Sierra公司正在实践结果导向的商业模式,探索AI编程新范式[2] 行业动态 - Skild AI最新进展聚焦解决真实数据不足问题,倡导融合多样化数据尤其是大规模视频数据[5] - 本期通讯包含30项AI&Robotics要事,其中国内8项、国外9项、技术13项[2]
科协年会助力青年人才挑大梁
科技日报· 2025-08-03 11:43
年会概况 - 第二十七届中国科协年会于7月1日至31日在北京举办,主题为"示踪科技前沿 助力创新发展",涵盖主论坛、专题论坛等6个版块百余项活动 [1] - 年会吸引7000余人次科技工作者参与,包括110余人次院士,其中40岁以下青年科技工作者占比57% [1] - 年会共开展990余个高水平学术报告 [1] 青年科技工作者参与 - 青年科技工作者深度参与并主导前沿讨论是本届年会亮点 [2] - 北京交通大学副教授张慧在"具身智能机器人"论坛中受到启发,将具身学习思想融入自身研究 [3] - 青年学者在会上直接向院士、专家提问,自由讨论氛围打破思维定式 [4] 学术交流机制 - 年会优化研讨机制,增加交流时长,聚焦非共识议题 [4] - 核工业西南物理研究院副研究员肖国梁参与核聚变论坛,跨领域讨论打破学识与年龄层级限制 [4] - 中国电机工程学会副秘书长申彦红表示年会鼓励科研不确定性和非共识观点,营造包容开放的学术环境 [4]
顶尖科学家带队,国内头部具身智能机器人企业完成数亿元新一轮融资!
Robot猎场备忘录· 2025-07-20 13:01
融资情况 - 跨维智能于2025年7月10日完成数亿元A1、A2轮系列融资,由成都科创投、洪泰基金领投,天鹰资本、四川院士基金、南山战新投、一村资本、探元创投等跟投,老股东联想创投持续加码[1] - 2025年1月16日完成Pre-A+轮融资,投资方为汇芯投资,金额未披露[1][2] - 公司累计完成8轮融资(含股权转让),包括2022年亿元级天使轮和Pre-A轮融资,2024年完成两轮融资[2] - 松禾资本为团队外第一大股东,持股9.7512%,天鹰资本持股5.1724%[2] 公司定位与技术 - 公司成立于2021年6月,最初定位为三维视觉软硬件研发企业,后转型为以Sim2Real为核心的具身智能技术企业[4][5] - 研发人员占比超70%,团队由全球Top2%顶尖科学家贾奎教授领衔[7] - 核心技术包括DexVerse™具身智能引擎,实现"三维数字资产生成-数据合成-物理仿真-模型训练-部署"全链条自动化[12] - 产品矩阵涵盖具身智能大脑(X-Wiz)、传感器及通用机器人,多模态感知系统支持毫秒级环境解析[13][14] 核心产品 - 2025年1月发布人形机器人DexForce W1,业内首款基于Sim2Real引擎定义的产品,身高170cm,双臂负载20kg,续航8小时[8][11] - W1配备34个动力单元(控制频率1000次/秒)、7自由度机械臂(单臂负载10kg)、6自由度灵巧手(力控精度20mA)[11] - 搭载DexVerse引擎实现虚拟仿真到真实世界的快速部署,纯视觉传感器支持复杂光照环境识别[11] 商业化进展 - 工业领域已实现100%合成数据驱动,毫米级操作精度下任务成功率超99.9%[16] - 覆盖汽车、新能源、3C电子等50+行业,服务头部车厂、电池厂商等客户,年营收达亿元级[16] - 累计开发上百家客户,落地数十场景,自称"具身智能工业场景落地第一名"[16] 行业竞争格局 - 国内人形机器人企业分"硬件派"(如宇树科技)和"软件派"(如智元机器人、银河通用),跨维智能属后者[17] - 具备AI能力且涉及本体的初创公司受资本青睐,2025年多家完成大额融资(如银河通用估值150亿)[17] - 行业共识认为自研机器人大模型是商业化核心壁垒,需构建技术闭环掌握主动权[18] 行业挑战 - 商业化场景多数处于POC阶段,实际价值待验证,技术壁垒存疑[19] - 硬件派面临"祛魅",软件派短期难落地,特斯拉Optimus砍单事件影响行业信心[19] - 量产与有效场景应用是主要难点,行业长周期特性显著[19]
MuJoCo具身智能实战:从零基础到强化学习与Sim2Real
具身智能之心· 2025-07-07 17:20
具身智能技术发展 - 具身智能正在全面崛起 重新定义人类与机器的关系 从Tesla的Optimus到Boston Dynamics的Atlas 全球顶尖科技公司都在布局这一领域 [1] - 具身智能将彻底改变制造业、服务业、医疗健康、太空探索等行业 使机器人在复杂环境中灵活移动并做出智能决策 [1] MuJoCo技术优势 - MuJoCo是连接虚拟世界与现实世界的重要桥梁 提供高保真、高效率的机器人训练环境 支持高度并行化计算 可同时运行成千上万个仿真实例 [4][6] - MuJoCo采用先进接触动力学算法 精确模拟机器人与环境的交互 提供视觉、触觉、力觉等多种感知模态 具有出色稳定性和数值精度 [6] - MuJoCo已成为学术界和工业界标准工具 Google、OpenAI、DeepMind等科技巨头都在使用 [8] 具身智能实战教程 - 课程采用项目驱动学习方式 包含六个递进式实战项目 从机械臂控制到人形机器人行走 再到多智能体协作和Sim-to-Real迁移 [9][12][13] - 项目一:构建六自由度机械臂模型 实现正逆运动学求解和PID控制 [15][16] - 项目二:为机械臂添加视觉感知能力 实现基于视觉的物体检测和抓取 [17][18] - 项目三:训练智能体学会复杂运动技能 如机械臂抛接球或四足机器人奔跑 [19][20] - 项目四:实现模型预测控制算法 进行实时轨迹优化 [21][22][23] - 项目五:设计多机器人协作系统 共同完成复杂任务 [24][25] - 项目六:通过域随机化技术实现Sim-to-Real迁移 在真实机器人上验证 [26][27] 技术能力提升 - 学员将掌握MuJoCo各项功能 能够构建复杂机器人仿真环境 实现高保真物理交互 [29] - 深入理解强化学习核心算法 掌握机器人控制理论和实践技巧 实现精确运动控制和轨迹跟踪 [29] - 具备完整项目开发经验 熟悉现代AI开发工具链 培养良好工程习惯 [31] 职业发展路径 - 技术专家方向:机器人算法工程师年薪30-60万 一线城市可达80-150万 [33] - 产品经理方向:年薪30-80万 有机会发展为技术总监或创业者 [33]
MuJoCo具身智能实战:从零基础到强化学习与Sim2Real
具身智能之心· 2025-06-24 22:29
具身智能技术发展 - 具身智能正在全面崛起 重新定义人类与机器的关系 通过结合语言理解与物理操作能力 实现从虚拟到现实的跨越[1] - 全球科技巨头如Tesla、Boston Dynamics、OpenAI、Google等均在布局具身智能领域 代表性产品包括Optimus人形机器人、Atlas、机械手和RT-X项目[1] - 该技术将革命性改变制造业、服务业、医疗健康、太空探索等多个行业 应用场景涵盖精密装配、手术协助、家庭服务及危险救援[1] MuJoCo技术核心价值 - MuJoCo作为物理仿真引擎 是连接虚拟与现实世界的关键桥梁 提供高保真高效率的机器人训练环境[4] - 解决传统机器人试错学习的高成本与低效问题 仿真速度可达现实时间的数百倍 支持极端环境下的无损训练[6] - 采用先进接触动力学算法 精确模拟机器人与环境交互 支持并行化计算、多模态传感器建模及长时间稳定仿真[6] - 已成为学术界与工业界标准工具 被ICRA、IROS、NeurIPS等顶级会议广泛采用 Google、OpenAI、DeepMind等公司均依赖其进行研究[8] 具身智能实战课程体系 - 课程设计六个递进式模块 每周聚焦特定技术目标 涵盖MuJoCo基础、强化学习、机器人控制、多智能体系统及Sim-to-Real迁移[13][16] - 包含六个实战项目:智能机械臂控制(六自由度模型与PID控制器)、视觉抓取系统(物体检测与光照模拟)、强化学习运动技能(抛接球/平衡控制)、自适应MPC控制、多机器人协作、Sim-to-Real迁移验证[19][21][23][25][27][29] - 采用PyTorch、Stable Baselines3等工具链 强调工程规范与调试技巧 项目均来自中国机器人企业实际应用场景[10][29] 技术能力与职业发展 - 学员将掌握MuJoCo仿真建模、强化学习算法设计、机器人控制理论及Sim-to-Real迁移等完整技术栈[32] - 职业路径包括机器人算法工程师(年薪30-150万)、AI研究工程师或仿真技术专家 产品经理方向年薪可达30-80万[35] - 课程采用离线视频教学与VIP群答疑模式 2025年7月15日开课 六周完成全部内容[37]
90 后北大博导造人形机器人,不学特斯拉
晚点LatePost· 2024-08-17 19:07
人形机器人行业发展现状 - 特斯拉Optimus人形机器人已在美国得州工厂投入使用,负责搬运4680电芯,引发关于"完美使用场景"和"失业风险"的讨论 [4] - 中国智能机器人公司银河通用在2024年完成7亿元天使轮融资,创下行业记录 [5] - 行业存在明显分歧:部分投资人认为当前技术不成熟,公司可能成为先烈;而创业者认为早期入场能积累技术和数据优势 [10][14] 技术路线差异 - 银河通用采用轮式底盘+双手设计,而非全人形,认为双手操作能力比双足运动更具商业价值 [7][18] - 双足机器人BOM成本是轮式底盘的10倍,且存在稳定性难题,目前全球无人形机器人能完成弯腰捡物动作 [19] - 特斯拉Optimus在工厂场景中实际并未使用双足功能,其工作内容完全可用传统机械臂替代 [20] 数据获取策略 - 特斯拉和Google采用"遥操"采集数据,但成本极高(Google花费10多个月仅获取十几万条数据) [9][25] - 银河通用选择"Sim2Real"路线,通过仿真合成数据,一秒钟可生成60张图像,成本接近零 [26] - 实验显示抓取任务数据量从10万次提升到10亿次时,成功率从58%提高到86%,验证数据规模效应 [24] 商业化路径 - 美国公司资金充裕可全人形开发,中国公司更注重PMF(产品市场匹配),从第一天就考虑商业化 [9][30] - 银河通用规划三阶段商业化:单一场景单一操作→同行业多场景→跨行业通用化 [34][35] - 首批产品定价50万元,主要面向科研和商业场景(如美团药房),目标未来将成本降至5万元/台 [39][42][43] 行业竞争格局 - 当前行业尚未形成规模经济效益,技术路线、产品形态和场景选择均无共识,反而有利于创业公司 [45] - 长期来看,进家庭+全人形+大模型被认为是技术终局,可能诞生特斯拉级别的领军企业 [46][47] - 中国制造业供应链优势明显(如宇树仅用几人半年就做出人形机器人demo),这是区别于美国的关键竞争力 [12]