AgiBot World

搜索文档
中国电子:WAIC2025前沿聚焦(5):全球具身智能产业化破局
海通国际证券· 2025-07-28 22:44
报告行业投资评级 报告未提及行业投资评级相关内容 报告的核心观点 - 2025年7月27日WAIC智启具身论坛释放三大技术拐点信号,标志具身智能从实验室走向规模化应用临界点确立 [1][18] - 数据 - 模型 - 本体 - 场景四轮驱动构建产业落地闭环,成为打破落地瓶颈核心范式,为千亿级市场打开商业化通道 [2][19] - Genie Envisioner平台将机器人决策模式升级,为服务机器人场景规模化落地提供底层引擎 [2][20] - 论坛呈现产研协同趋势,学术与产业双轮驱动技术融合,全球智慧融合加速技术 - 产业正循环 [3][21] - 开源操作系统重塑产业底层逻辑,灵渠OS开源生态剑指具身时代的“Windows”地位,生态开放性与场景渗透效率是厂商卡位关键 [4][22] 根据相关目录分别进行总结 事件 - 2025年7月27日WAIC智启具身论坛以全球视角下具身智能新机遇为主题,汇聚全球顶尖机构,释放三大技术拐点信号:数据荒漠终结,智元开源全球最大具身数据集AgiBot World;世界模型落地工业场景,发布首个双臂机器人世界模型平台Genie Envisioner;操作系统开源生态启动,智元明确分层开源生态战略 [1][18] 点评 - 数据 - 模型 - 本体 - 场景四轮驱动构建产业落地闭环,智元通过自建数采工厂构建并开源AgiBot World数据集解决数据稀缺痛点,启元大模型适配异构机器人本体,工业制造、仓储物流等四大领域已验证生产力重构价值 [2][19] - Genie Envisioner平台将机器人决策模式升级为“想象 - 验证 - 行动”自主闭环,技术架构融合多视角视频扩散模型与160M参数动作解码器,时空一致性建模是关键突破,后续将扩展全身移动与人机协作支持 [2][20] - 论坛呈现产研协同趋势,斯坦福等高校与工业界合力攻克“虚实泛化”挑战,清华大学苏航提出方法论,英伟达等产业界拆解路径、迭代验证,圆桌环节指出跨模态理解与群体协同是下一阶段技术攻坚重点 [3][21] - 开源操作系统重塑产业底层逻辑,灵渠OS分层架构将于2025Q4开源,统一硬件适配与开发标准,竞品商汤同日推出“悟能”平台但未开放生态,京东布局场景应用,生态开放性与场景渗透效率是厂商卡位关键 [4][22]
机器人数据采集助力智能化进阶
快讯· 2025-06-19 07:29
公司动态 - 智元数据采集中心在上海浦东运营 通过"数据+AI"提升机器人智能化水平 [1] - 自2024年9月启动以来 该中心已采集超百万条高质量数据 覆盖多种真实场景 [1] - 智元机器人开源了百万真机数据集AgiBot World [1] - 发布了通用具身基座模型GO-1 提升机器人学习效率 [1] - 今年4月推出Genie Studio平台 为开发者提供一站式解决方案 [1] - 预计2025年将进入量产化元年 推动产品商用 出货量达数千台 [1] - 公司已完成新一轮融资 支持其智能化进程 [1]
未来智造局|“突围”具身智能数据难题
新华财经· 2025-06-06 15:18
人形机器人行业发展现状 - 人形机器人在全地形动态挑战赛、工业场景赛、家庭场景赛、商业场景赛等五大赛道28个高难度场景中表现出一定自主性,例如自主寻找和归类物品 [1] - 行业在精度、速度、泛化度等维度仍显不足,训练数据不足是主要瓶颈,特斯拉、谷歌及国内企业正通过建设训练场和数据集解决,但面临成本高、周期长问题 [1] - 合成数据技术路线已有突破,完全基于合成数据训练的具身智能大模型开始商用落地 [1] 具身智能训练数据挑战 - 具身智能训练数据稀缺,与文本数据相比数量差距可能达百万倍,多模态数据尤为缺乏 [2] - 特斯拉通过远程操作记录动作和环境数据,谷歌DeepMind联合斯坦福推出Open X-Embodiment Dataset含100多万条真实机器人轨迹,智元开源百万真机数据集AgiBot World [2] - 头部车厂每日数据回流达1亿条,但具身智能领域最大数据集仅百万条规模,数据不足导致模型训练效率低、场景适应能力弱 [3] 合成数据技术应用与局限 - 银河通用展示完全基于合成数据训练的GraspVLA大模型,采用10亿级合成数据,已应用于24小时无人药店,单店可管理5000多种药品、6000多个货道,北京6家门店常态化运营,年底计划扩展至全国100家 [4] - 合成数据生成视觉数据较成熟,但触觉、温度、声音等多模态数据生成仍存挑战,仿真与真实环境匹配度不足影响数据有效性 [5] - 行业通过"模拟到现实"迁移技术缩小模拟与物理环境差距,需引入物理规律约束以提升数据质量 [6] 异构数据互通解决方案 - 国地中心启动具身智能训练场,进驻100多台全尺寸人形机器人,探索数字与物理世界链接 [6] - 推出"格物-致知"开发平台,收集100多款机器人构型,通过仿真平台对齐异构数据并实现跨平台映射,避免基础功能重复训练 [7] - 计划在7月WAIC期间发布多项重要成果,解决行业数据互通痛点 [7]
具身智能数据:AI时代的石油
东吴证券· 2025-06-05 09:23
报告行业投资评级 未提及 报告的核心观点 - 数据是推动具身智能技术快速突破和落地应用的关键,优质数据集能驱动智能体感知与理解环境,加速具身智能模型的训练与部署,帮助机器人完成复杂任务 [3][17] - 具身智能数据按采集方式分为真实数据和仿真数据,两者互补,未来训练将大量混合使用 [3][22] - 目前具身智能数据多为厂商自采集,存在丰富开源数据集,但大规模真机数据采集成本高 [3] - 机器人仿真数据依赖虚拟场景,场景合成方案可拆解为场景生成与模拟两部分 [3] - 建议重点关注布局具身智能数据集的企业,如均胜电子、海天瑞声、索辰科技、华如科技 [3][76] 根据相关目录分别进行总结 具身智能数据集基本概念 - 具身智能的关键因子包括算法、算力、机器人硬件和数据,目前数据是世界级难题 [11] - 数据是具身智能技术突破和应用的关键,但高质量、多样化数据集稀缺,构建此类数据集是基础工作,且数据集的标准和有效很重要 [17] - 数据采集的关键价值包括促进通用智能形成、增强环境理解能力、支持任务迁移与泛化、提升实时决策能力,其难点包括高昂成本、数据复杂性、覆盖面不足、仿真 - 现实差距和设备差异性 [21][20] - 具身智能数据分为真实数据和仿真数据,真实数据通过传感器在真实环境交互采集,来源有机器人遥操和动作捕捉;仿真数据借助计算机模拟技术在虚拟环境生成,两者互补,未来将混合使用 [22][24] - 具身智能数据质量把控重要,中国信通院等编制了相关标准,国家地方共建具身智能机器人创新中心牵头立项行业标准并发布多项报告,加速具身智能行业良性发展 [27] 国内外具身智能真实数据集现状 - 当前具身智能机器人数据多为厂商自采集,采集方式有直接接触和间接接触两种,真机数据采集成本高,市面上存在丰富高质量开源数据集 [32] - 介绍了多个具身智能开源数据集,如智元的AgiBot World、谷歌的Open X - Embodiment、国地共建中心的RoboMind等,涵盖演示数量、场景任务、动作技能等信息 [30] - 智元的AgiBot World是全球首个基于全域真实场景等的百万真机数据集,长程数据规模、场景范围覆盖面等优于谷歌相关数据集,涵盖多种场景和操作对象,基于特定机器人采集数据 [35] - 谷歌的Open X - Embodiment是开放的大规模标准化机器人学习数据集,研究人员训练了RT - 1和RT - 2模型 [38] - 国地共建中心的RoboMind数据集解决了全球开源数据集的一些问题,采用多种形态机器人采集数据,涵盖多任务多场景,计划开源数据 [41] - 特斯拉Optimus机器人的数据有三个来源,目前数据来自VR遥操和动捕手套 [45] - 国家地方共建人形机器人创新中心启用具身智能训练场,助力数据采集 [46] 国内外具身智能仿真数据集现状 - 机器人仿真数据依赖虚拟场景,场景合成方案可拆解为场景生成与模拟,场景生成引擎有合成视频 + 3D重建和AIGC直接合成3D数据两种技术路径 [3][52] - 群核科技是空间智能领军企业,其SpatialVerse为机器人提供优质数据服务,构建物理正确的数据集库 [60] - Hillbot专注具身合成数据,利用3D生成式AI技术生成数据和模拟互动 [61] - World Labs专注空间智能,发布空间智能模型,生成逼近物理世界的3D环境建模 [64] - 智元推出AgiBot Digital World仿真框架,开源海量仿真数据集,涵盖多种场景、物品、材质和技能 [67] - CMU联合开源生成式物理引擎Genesis,为机器人提供统一模拟平台 [68] - 英伟达的NVIDIA Isaac Sim结合Cosmos可生成可控合成数据,同时发布的Isaac GR00T Blueprint可帮助开发者生成合成轨迹数据 [74] 相关标的 - 重点关注布局具身智能数据集的企业,包括均胜电子(数据场)、海天瑞声(机器人数据集)、索辰科技(数据仿真)、华如科技(数据仿真) [76]
腾讯入股,华为“天才少年”!
证券时报· 2025-03-24 17:46
腾讯入股智元机器人 - 腾讯通过旗下广西腾讯创业投资有限公司入股智元机器人关联公司上海智元新创技术有限公司,持股比例约2.06% [1][3] - 此次工商变更中,原股东临港新片区道禾前沿碳中禾私募投资基金等退出,新增股东还包括卧龙电驱 [1][3] - 公司注册资本从约7637万元人民币增至约8046万元人民币,同时法定代表人由舒远春变更为邓泰华 [4] 智元机器人股东结构 - 公司股东阵容豪华,包括比亚迪持股2.38%、高瓴资本、软通动力持股1.34%、蓝驰创投持股2.11%等知名机构 [4][5] - 公司由桑蓬科技合伙企业、管鲍科技合伙企业等及新增股东共同持股 [5] - 腾讯此次入股后成为公司重要战略投资者之一 [3] 公司业务与发展 - 智元机器人成立于2023年2月,专注于智能机器人研发、服务消费机器人销售和人工智能算法开发 [5] - 2024年12月公司开启通用机器人商用量产,2025年1月实现第1000台通用具身机器人下线 [8] - 2024年3月发布首个通用具身基座模型GO-1,基于包含100万条轨迹、217个任务的大规模数据集AgiBot World [8] 创始人背景 - 创始人稚晖君(彭志辉)为前华为"天才少年",2020年以百万年薪加入华为昇腾部门从事AI芯片研究 [7] - 2022年底从华为离职创业,凭借在B站发布的硬核科技视频积累了大量粉丝,被称为"野生钢铁侠" [7] - 本科毕业于电子科技大学生物医学工程,研究生转向信息与通信系统专业,具备跨学科背景 [7]
【机械】智元发布首个通用具身基座大模型GO-1,具身智能加速进化——具身智能系列报告(二)(黄帅斌/陈佳宁/李佳琦)
光大证券研究· 2025-03-11 21:03
文章核心观点 2024年底智元推出AgiBot World数据集,2025年3月10日正式发布智元通用具身基座大模型Genie Operator - 1(GO - 1),其创新性架构和特点使其在具身智能领域有显著优势,将加速具身智能普及,推动机器人向通用智能自主体发展 [2][3][4] 事件 - 2024年底智元推出AgiBot World,含超100万条轨迹、涵盖217个任务、涉及五大场景的大规模高质量真机数据集 [2] - 2025年3月10日智元正式发布智元通用具身基座大模型Genie Operator - 1(GO - 1) [2] 点评 - GO - 1从VLA进化到ViLLA创新性架构,由VLM(多模态大模型)+ MoE(混合专家)组成,VLM获通用场景感知和语言理解能力,MoE中Latent Planner获通用动作理解能力,Action Expert获精细动作执行能力 [3] - 通过实验任务测试,GO - 1相比已有最优模型成功率大幅领先,平均成功率从46%提高到78%,增加Latent Planner可提升12%的成功率(从66%到78%) [3] 小样本快速泛化,能力持续快速进化 - GO - 1借助人类和多种机器人数据使机器人学习能力泛化到各类环境和物品,快速适应新任务、学习新技能,支持部署到不同机器人本体并持续进化 [4] - 特点包括人类视频学习,结合互联网视频和真实人类示范学习,增强对人类行为理解 [4] - 特点包括小样本快速泛化,有强大泛化能力,能在极少数据甚至零样本下泛化到新场景、新任务,后训练成本低 [4] - 特点包括一脑多形,是通用机器人策略模型,能在不同机器人形态间迁移,快速适配不同本体,群体升智 [4] - 特点包括持续进化,搭配数据回流系统,可从实际执行问题数据中持续进化学习 [4] - GO - 1推出标志具身智能向通用化、开放化、智能化方向迈进,将加速具身智能普及,推动机器人从依赖特定任务工具向具备通用智能自主体发展,在多领域发挥更大作用 [4][5]