Workflow
通用具身智能
icon
搜索文档
百万规模数据集打造人形机器人通用大模型,实现精细动作跨平台、跨形态动作迁移丨北大人大联合发布
量子位· 2025-05-14 16:55
技术突破 - 北大和人大团队首创具备数据-模型协同放量特性的通用动作生成框架Being-M0 [1] - 构建业界首个百万规模动作生成数据集MotionLib,规模达现有最大公开数据集的15倍 [4][10] - 研发端到端文本驱动动作生成模型,实现人体动作向多类型人形机器人的迁移 [2] 数据集创新 - 从2000万段视频中筛选出100万条高质量动作序列,建立全自动化处理流程 [7][10] - 采用分层标注方案,利用Gemini-1.5-pro生成结构化描述,细化到身体部位运动特征 [10] - 数据集包含RGB视频、深度信息等多模态数据,支持多人交互场景分析 [10] 模型架构 - 验证模型规模与数据规模的协同放大效应,13B参数模型比700M参数模型性能显著提升 [13] - 提出MotionBook二维无查找量化框架,使动作词表容量提升两个数量级 [16] - 空间-时序解耦编码保留运动多维结构特征,解决传统VQ技术信息损失问题 [16] 动作迁移 - 创新"优化+学习"两阶段方案,实现人体动作向宇树H1/H1-2/G1等机器人的高效迁移 [6][19] - 多目标优化生成满足机器人运动学约束的动作序列,保证数据质量 [20] - 轻量级MLP网络学习映射关系,提升系统实时性能同时保持准确性 [20][21] 应用前景 - 为构建通用动作生成模型提供关键设计准则,奠定通用动作智能基础 [5][14] - 推动人形机器人具身大模型、灵巧操作等技术的发展 [22] - 项目将持续迭代,目标是让机器人具备更强通用能力和自主性 [22]
北京一季度产业经济亮点纷呈:增长强劲、创新加速、信心攀升
新京报· 2025-04-28 19:00
产业经济表现 - 一季度北京工业和信息软件业增加值突破4000亿元 占全市GDP比重超过35% [3] - 全市GDP增速5.5% 工业和信息软件业贡献近3个百分点 规上工业增加值增长6.8% 增速跑赢全国 [3] - 汽车制造和电子信息业增加值分别实现17.2%和28%的高速增长 [3] 创新动能发展 - 国际医药创新园吸引美敦力、阿斯利康、辉瑞三大巨头研发中心入驻 [3] - 高技术制造业和战略性新兴产业均保持两位数增长 [3] - 数字经济增加值同比增长8.3% 其中核心产业增长9.7% [3] - 自动驾驶新规落地 国产算力验证中心平台投用 全球首个通用具身智能平台"慧思开物"亮相 [3] 重大项目投资 - 京津冀新能源汽车科技生态港等重大项目落地开工 [4] - 工业重点产业投资增长23.1% 信息软件业投资激增1.8倍 [4] 出口贸易表现 - 规上工业出口交货值突破500亿元 创近3年同期新高 [4] - 汽车出口增长52% 电气机械出口增长1.2倍 [4] 市场信心指标 - 前两月信息软件业利润增幅达37.5% 研发投入保持两位数增长 [4] - 制造业PMI重返扩张区间 [4] - 一季度新设工业企业增长25.7% 信息软件业企业注册量激增1.8倍 [4]
谷歌VS Figure AI VS成都:人形机器人的“脑”力角逐
机器人大讲堂· 2025-04-22 16:28
全球人形机器人产业技术革命 - 全球人形机器人产业正迎来"大脑"技术革命,2025年初美国Figure AI、谷歌DeepMind和成都人形机器人创新中心先后发布通用具身智能大模型,争夺产业标准话语权 [1] 谷歌DeepMind技术路径 - 谷歌DeepMind发布基于Gemini 2.0的机器人AI模型Gemini Robotics和Gemini Robotics-ER,目标构建通用机器人生态 [1] - Gemini Robotics在泛化性、交互性和灵巧性三方面提升:泛化能力比现有模型提高一倍,能处理训练中未遇到的任务;语言理解能力优秀,可实时调整路径;能精确操作复杂多步骤任务 [1][3] - Gemini Robotics-ER专注于增强空间推理能力,如识别咖啡杯把位置并规划安全接近路径 [5] Figure AI技术路径 - Figure AI发布Helix端到端视觉-语言-动作通用控制模型,泛化能力、动作精度与实时性显著提升,已在宝马工厂试点 [5] - Helix采用"系统1+系统2"双系统架构:S2解析指令并规划任务目标,S1以毫秒级响应生成动作;具备跨物体泛化能力,可直接部署在低性能芯片上;支持多机器人协作,共享神经网络权重和实时环境感知数据 [5][7] 成都创新中心技术路径 - 成都人形机器人创新中心发布Raydiculous—1系统,国内首个基于3DSGs的自主跨空间任务规划推理执行系统,突破单一场景限制 [9] - Raydiculous—1具有跨场景、长视野、轻量型特点:通过3DSGs实现跨空间连续任务执行;采用长视野任务规划引擎分解复杂任务;模块化设计降低算力需求,硬件成本仅为同类方案1/3 [10][12][15] 技术路径对比 - 谷歌依赖云端算力打造通用机器人生态,Figure AI专注工业场景实时响应,成都方案侧重家庭服务等民生领域轻量化本地部署 [16] - 核心差异:算力需求方面谷歌需千卡集群而成都成本优势显著;联网需求方面谷歌需联网而Figure与成都减少云端依赖;规划能力方面成都具备长视野跨空间优势 [17] - 三家均采用"规划-执行"分层策略,致力于提升机器人日常事务与家务劳动能力 [17] 产业竞争格局 - 人形机器人"大脑"技术是算法竞赛与国家高端制造能力的试金石,中国通过根技术创新可能绕开欧美技术霸权开辟万亿美元级市场 [18] - 产业生态涉及工业机器人、服务与特种机器人、医疗机器人、人形机器人及核心零部件企业 [23][24][25]
机器人马拉松“名场面”刷屏!“宇树摔倒”引热议,最新回应……
环球网资讯· 2025-04-20 09:40
全球首个人形机器人半程马拉松赛事 - 全球首届人形机器人半程马拉松在北京亦庄举行,20支赛队完成21.0975公里赛程 [1] - 比赛设置冠亚季军及完赛奖、最佳耐力奖、最佳人气奖等专项奖,奖牌为机器人形状 [14] - 冠军天工队用时2小时40分42秒未更换机器人,亚军小顽童队更换一次机器人用时3小时37分50秒,季军行者二号队更换两次机器人用时4小时25分56秒 [14] 参赛机器人技术表现 - 天工Ultra机器人身高1.8米,配速7-8千米/时,通过优化运动控制算法增强关节协调能力 [23] - 部分机器人出现故障:美女机器人"幻幻"开跑即罢工,有机器人头部掉落但继续比赛 [6] - 机器人存在续航告急和关节过热问题,需人类队友喷射冷却液 [15] - 机器人步态差异明显,高个子不一定比小个子有优势 [11] 参赛企业动态 - 天工Ultra机器人将时速从6千米/时提升至12千米/时,搭载"慧思开物"智能平台 [23] - 宇树科技G1机器人由第三方客户参赛,官方回应称不同操作团队表现差异大 [17][19][21] - 北职大"0306"小巨人机器人虽体型最小但能与观众互动 [4] 行业影响与公众反应 - 比赛吸引大量观众,人类选手表示更关注机器人表现而非个人成绩 [13] - 媒体评论认为尽管机器人步态不完美,但公众表现出极高热情和包容度 [25] - 赛事被视为人形机器人技术发展的重要里程碑,体现科技创新潜力 [25]