合成数据

搜索文档
数据:99%+1%,能实现“从0到10000”——银河通用王鹤:让机器人甩掉遥控器,“睁开眼”干活
新华社· 2025-09-16 05:46
公司业务与产品 - 公司专注于研发人形机器人硬件和具身智能大模型 率先实现机器人在工业 零售等场景批量落地[2] - 公司自研机器人Galbot无需遥控 能自主干活 在机器人格斗赛等赛事上斩获佳绩[2][3] - 公司在工业场景实现流水线搬运 分拣等环节规模化应用 零售场景已在北京海淀落地10多家配备人形机器人的智慧药房 并计划年内在全国开设100家[5] - 公司机器人已开始售卖零食 咖啡等商品 全球首个城市级常态化运营人形机器人示范区落地北京[2][5] 技术路径与突破 - 公司采用端到端VLA(视觉-运动-动作一体化生成)技术路径 依靠视觉反馈闭环展现实际场景干活能力[4] - 2024年初公司以10亿级合成大数据端到端训练VLA大模型 实现跨场景移动物体抓取 6月推出端到端导航大模型使机器人拥有"听-看-懂-走"闭环运动能力[6][7] - 硬件性能需够用 好用且精度高 是拿掉遥控器的另一核心[8] - 公司通过高质量合成数据解决99%的具身智能数据需求 仅1%需真实数据采集[9] 行业现状与挑战 - 当前多数机器人依赖人工遥控 演示视频多为预编排动作序列与视频剪辑共同结果 存在泛化性不足和硬件不可靠问题[4][5] - 具身智能最大困境在于数据丰富性和准确性 而非硬件或模型[3] - 头部人形机器人厂商量产规模仅千台级别 未达万台规模 真实数据采集不具备现实可行性[9] - 未来3年可批量复制场景落地是行业生死分水岭 未来1年需实现千台到万台批量交付验证行业价值[12] 数据战略与模型 - 数据决定机器人能力下限 高质量数据需多元性 覆盖柔性物体操作和场景泛化性[9][10] - 合成数据解决0到1问题 真实遥操数据解决1到100问题 视频数据处理解决100到10000问题[9] - 模型架构虽未完全成熟但已够用 数据起决定性作用 数据足够时好模型能学得更好[11] - 生成高质量合成数据需图形学 物理仿真 物理渲染 自动动作合成管线等基础设施和核心技术积累[9] 商业化与应用前景 - 彻底解决抓取 移动 放置等简单操作泛化性问题可打开数千亿元市场 应用覆盖零售 前置仓 车厂分拣等多个场景[12] - 机器人核心功能是替代人力劳动 非展示性动作 需具备24小时工作高可靠性[5] - 智能定义为解决问题的能力 人类 动物和机器人调用能力方式不同但均体现智能[13]
机器人跨越“三重门”——具身智能创新者亲历的现实与趋势丨议事厅
新华网· 2025-09-15 11:44
行业现状与趋势 - 人形机器人赛道呈现"冰与火之歌"态势 一边是机器人进厂打工、酒店送餐、赛场踢球等火热应用场景 一边是融资超百亿但订单不过百台的商业落地困境 [1] - 投资机构从观望转向竞逐 行业格局从"人形机器人第一股"一枝独秀发展到超20家产业链企业走向IPO [1] - 具身智能面临技术路径与商业落地的十字路口 未来3年能否击穿场景将成为企业生存的关键分水岭 [1][15] 技术突破与路径 - 银河通用通过10亿级合成大数据训练端到端VLA大模型 实现机器人自主执行能力 其机器人Galbot已实现无需遥控自主干活 [5][10] - 数据质量成为具身智能发展核心瓶颈 99%能力可通过高质量合成数据实现 仅需1%真实数据辅助 但高质量数据需具备多元性和泛化性特征 [12][13] - 自变量机器人开发通用具身大模型WALL-A 采用"一脑多用"端到端技术 实现零样本泛化能力 能处理拉链变形等动态异常情况 [20][26][27] - 加速进化通过足球赛事训练机器人全自主运动能力 其"感知-决策-控制"智能系统可在0.1秒内完成判断 支撑奔跑、急停、射门等复杂动作 [39] 商业化应用进展 - 银河通用已在工业场景实现流水线搬运、分拣等环节规模化应用 在零售场景落地10多家智慧药房 并计划年内扩展至100家 [8] - 全球首个城市级人形机器人示范区落地北京 银河通用推出由机器人经营的"银河太空舱"无人超市 标志具身智能进入日常生活 [5] - 加速进化通过机器人足球赛事获得商业突破 帮助中国队首夺RoboCup成人组冠军 打破欧美国家28年垄断 [36] 技术路线分歧 - 行业分化出"运动展示派"与"实干派"两大方向 宇树科技代表运动能力展示路线 银河通用代表实际场景干活路线 [8] - 端到端模型与分层模型存在技术路线竞争 端到端模型可实现实时感知决策闭环 而分层模型存在误差累积和延迟问题 [25][26] - 自动驾驶模型无法直接迁移至机器人领域 因机器人核心难点在于复杂操作而非导航运动 [32] 成本与规模化挑战 - 人形机器人单台成本超10万元 加上维修成本更高 而工人年薪仅5-8万元 成本效益比尚未达到商业规模化要求 [42] - 头部厂商量产规模仅千台级别 未达万台规模 制约数据采集和模型迭代速度 [12] - 工业场景存在技术匹配度问题 现有专机设备已实现高度自动化 人形机器人入厂可能造成"瑞士军刀切菜"的错配现象 [43] 未来发展路径 - 未来1年实现千台到万台批量交付将成为行业价值验证关键节点 [15] - 操作系统生态构建被视为核心护城河 通过开发者生态推动软硬件快速迭代 [40] - 家庭场景被定位为终极目标 因其数据是"活"的 而工业场景数据相对固定且迁移价值有限 [43]
银河通用张直政:具身大模型的发展需要上万亿条数据
第一财经· 2025-09-11 15:33
(文章来源:第一财经) 9月11日,在外滩大会上,银河通用机器人联合创始人张直政表示,具身大模型的发展可能需要上万亿 条数据。这些数据如果全部真实采集,数量不够而且也不可持续。这使得合成数据成为不可避免的选 择。 ...
合成数据的「毒」与「药」,模型崩溃有何新解?
机器之心· 2025-08-30 09:30
本文来自PRO会员通讯内容,文末关注「机器之心PRO会员」,查看更多专题解读。 引言 :在 2025 年里,围绕合成数据的研究取得了进展。一方面,学者们对模型在合成数据自循环训练下的崩溃机理有了更系统的揭示。另一方面,业界逐渐建立起 合成数据在生成、预训练、微调、后训练与评估等环节的应用流程。同时,一系列新提出的策略也为避免模型退化提供了可能路径,使合成数据在大模型发展中的作 用更加清晰。 目录 01.一年过去,关于合成数据的 「毒性」研究有何新发现? 合成数据为什么会在迭代训练中逐代污染训练集?模型在早期和晚期崩溃表现出了怎样的差异?不同类型生成模型(LLM、VAE、GMM)崩溃机制有何共性和差异?... 02 . 合成数据全面上场,在训练流程中扮演了哪些角色? 2、这种崩溃是一个退化过程,模型生成的文本逐代污染后续训练数据集,新一代模型逐步丧失对真实数据分布的认识,输出也越来越同质化。[2-1] ① 研究表明,在早期崩溃阶段,模型开始丢失分布尾部(低概率事件)的信息。 ② 在晚期崩溃阶段,模型将收敛到同原始分布几乎没有任何相似之处。 ③ 这一过程的发生,同模型设计、学习过程和所用数据质量有关。 3、经 S ...
清华大学张小劲谈数据标注:高质量数据集走到哪,AI就到哪
南方都市报· 2025-08-29 14:50
行业发展趋势 - 数据标注产业进入新战略阶段 行业逐步完善并走向成熟 催生新职业和职业技能标准 [3] - 传统人工标注市场竞争激烈且内卷化 用工需求规模大且流动性高 [4] - 未来大模型将带动标注工作 智能检测和工具优化成为长远发展方向 [4] - 合成数据领域发展值得关注 通过AI数据搭接适应发展需求 [5] 地域与行业分布 - 用工需求从低成本地区向经济发达地区和人工智能前沿领域转移 [4] - 河南、四川等人力资本丰富地区呈现活跃发展态势 [4] - 行业主要集中在信息技术和科学研究领域 人工智能先导研究行业用工需求最旺盛 [4] 企业分类与发展模式 - 数据标注企业可通过2×2矩阵按场景强度和基础强度划分为双强、双弱、偏强、偏弱四种类型 [5] - 具身机器人行业发展较好 技术具有引领性 [5] - 大型产业和企业拥有更多专业力量开发模型并进行数据标注 [5] - 国外场景团队专注于垂直场景的数据采集和标注 [5] - 外包团队和众包团队提供灵活低成本劳动力 众包团队在小众场景创新方面具有优势 [5] 发展战略建议 - 推进AI辅助标注与全自动化标注技术 使产业从劳动密集型向知识密集型转变 [8] - 建立多轮质检与反馈机制 完善质控体制 精准淘汰劣质数据 [8] - 开发行业针对性标注系统 利用中国丰富应用场景和数据资源推动垂直细分领域发展 [8] - 深化校企合作加速技术转化 推动行业标准制定 [9] - 强化技能培训优化人力配置 建立质量追踪机制提升从业人员专业技能 [9] 核心发展理念 - 大模型人工智能与高质量数据集形成相辅相成、双轮驱动的格局 [1][6][8] - 人工智能+行动到哪里 高质量数据集就走到哪里 [6] - 高质量数据集走到哪里 人工智能就走到哪里 [1][6][8]
打破瓶颈,让RAG学会思考:中科大、智源等发布推理检索框架BGE-Reasoner
机器之心· 2025-08-27 16:36
机器之心发布 机器之心编辑部 人工智能的浪潮正将我们推向一个由 RAG 和 AI Agent 定义的新时代。然而,要让这些智能体真正「智能」,而非仅仅是信息的搬运工,就必须攻克一个横亘在所 有顶尖团队面前的核心难题。这个难题,就是 推理密集型信息检索(Reasoning-Intensive IR) 。 它不仅是当前 RAG 和 AI Agent 技术发展的关键瓶颈,更对大模型智能体和深度研究(DeepResearch)等应用场景的成败具有决定性意义。 正当全球研究者都在为此寻求突破之际,我们看到了一项来自中国的贡献: BGE-Reasoner 。 BGE-Reasoner 由来自中国科学技术大学、智源研究院、北京邮电大学与香港理工大学等机构的联合团队研发,是一套用于推理密集型信息检索任务的创新的端到 端解决方案。通过系统性的查询理解、向量检索与重排序,该方案可显著提升搜索引擎在推理密集型信息检索任务中的表现。 在权威评测基准 BRIGHT 上,BGE-Reasoner 取得 45.2 的测试得分,以显著优势刷新了该基准的最佳纪录。 作为 BGE 系列模型的又一重要里程碑,BGE-Reasoner 不仅实现了性 ...
中信证券:短期建议关注具身模型行业的资本布局者及数据采集卖铲人
第一财经· 2025-08-25 08:58
模型架构发展 - 大语言模型、大型视觉模型与动作模型融合是当前架构主旋律 [1] - 基于扩散模型的流匹配算法在短期逐渐占据主导地位 [1] 数据战略竞争 - 强资本开支企业以真实数据采集为突破口构建竞争壁垒 [1] - 合成数据及互联网数据因规模化与泛化属性成为重要价值底色 [1] - 数据样方理念持续兴起 预训练及后训练需与数据属性有机结合 [1] 技术赋能方向 - 世界模型对合成数据和策略评判具备规模化赋能潜力 [1] 投资关注重点 - 短期建议关注具身模型行业资本布局者及数据采集卖铲人 [1] - 长期维度建议关注云计算及算力提供者 [1]
院士孵化,机器人合成数据公司获合肥国资A轮融资丨早起看早期
36氪· 2025-08-22 08:21
公司融资与背景 - 公司完成A轮融资 由合肥高投领投 合肥创新投 安徽省创投 科大硅谷基金 青岛西海岸人才生态产业集团跟投 帕累托森林担任独家融资财务顾问[5] - 所融资金将用于合成数据生成技术 持续学习框架及世界模型的研发 加快在自动驾驶 工业场景与具身机器人领域的应用[5] - 公司成立于2019年 由2000年图灵奖得主姚期智院士孵化 总部位于合肥高新区[5] - 公司已完成四轮融资[5] 业务与产品 - 公司专注数据采集-数据处理-仿真训练闭环工具链[4][5] - 推出三大核心产品 数据采集系统Oasis Rover 数据平台Oasis Data 仿真系统Oasis Sim[5] - 服务自动驾驶 机器人及工业数字孪生三大场景[5] - 高保真仿真与合成数据软件产品是主要创收产品 客户以车企和研究院所为主[10] - 已与10余家头部车企与工业企业达成合作[10] 行业痛点与解决方案 - 工信部要求L3+车型完成1000万公里等效测试 传统人工建模100万公里需6个月 成本高昂且极端场景覆盖率不足[7] - 核电 港口等工业场景面临数字孪生精度低 跨场景适配成本高的痛点[7] - AI训练中人工标注数据存在局限 效率难以匹配需求增长 成本较高 数据量增加时标注质量可能下降[7] - 公司通过合成数据技术解决行业痛点 AI训练数据组合将从99%真实数据+1%合成数据转向1%真实数据牵引+99%合成数据主导[7] 核心技术 - 持续学习框架通过真实数据种子→多智能体动态对抗→自主泛化迭代闭环 实现场景真实性 挑战性与多样性[8] - 依赖Oasis Rover设备采集相关时序数据 将仿真环境元素建模为对抗智能体进行动态博弈 自主生成海量泛化场景 场景难度可随算法性能调整[8] - 世界模型融合多种技术 构建几何-物理-语义一致的数字孪生系统 包括环境动态建模 多智能体交互预测及虚实融合校准等环节[10] - 在与某头部汽车公司合作中 基于上述技术的合成数据使自动驾驶算法测试效率提升210万倍[10] 技术应用与验证 - 合成数据技术在自动驾驶领域覆盖传统路测难以触及的场景[10] - 在工业场景模拟设备老化与故障演化 提升调度算法效率[10] - 在机器人领域复用相关技术模拟物理交互 拓展应用场景[10] 财务表现与增长 - 去年公司营收成倍增长[10] - 预计今年在去年基础上实现数倍增长目标[10] 团队构成 - 公司现有团队80人 其中研发团队10%是美国宾夕法尼亚大学 加州大学洛杉矶分校等海外顶级名校博士[11] - 核心成员多具备计算机 物理学等相关专业背景 在自动驾驶 人工智能 仿真建模等领域拥有深厚积累[11] - 创始人兼CEO杨子江为美国宾夕法尼亚大学博士 现任中科大教授 发表数十篇CCF A类论文 担任IEEE自动驾驶标准组副主席[11] - 顾问团队包括Moshe Vardi院士等 形成产学研结合的研发体系[11]
英伟达回应美国政府向特许对华出口AI芯片征收15%“交易许可税”;OpenAI CEO呛声马斯克丨AIGC日报
创业邦· 2025-08-13 08:07
英伟达对华AI芯片出口政策 - 美国政府向英伟达特许对华出口的AI芯片H20 GPU征收15%营收作为交易许可费 最初要求20% 经协商降至15% [1] - 英伟达回应称遵守美国政府规则 将继续在规则范围内为全球客户提供服务 [1] OpenAI与马斯克争议 - OpenAI CEO Sam Altman转发马斯克帖文 希望对其操纵X平台行为展开反调查 [2] - Altman引用2023年媒体文章 指控马斯克曾施压推特团队提升自己推文权重 [2] 英伟达机器人技术进展 - 推出NVIDIA Omniverse库和Cosmos世界基础模型 加速机器人解决方案开发 [3] - 新技术由RTX PRO服务器和DGX Cloud支持 可开发数字孪生 生成合成数据 构建物理AI智能体 [3] 华为AI推理技术创新 - 发布UCM推理记忆数据管理器 以KV Cache为中心的推理加速套件 [4] - 技术可扩大推理上下文窗口 实现高吞吐低时延 已在中国银联三大业务场景试点应用 [4]
英伟达、宇树、银河通用问答:未来10年机器人如何改变世界
21世纪经济报道· 2025-08-12 06:20
行业趋势与市场潜力 - 计算机和IT产业过去三四十年主要影响"信息空间",规模约5万亿美元,而全球产业总量超过100万亿美元,更大的价值在于触达物理世界的"原子"领域(如交通、制造、物流、医疗)[1] - 人工智能的出现使机器具备"物理智能"能力,计算机力量将进入100万亿美元的物理世界市场,机器人是实现这一跃迁的桥梁[1] - 中国在人工智能领域具备独特优势,全球近一半人工智能研究人员和开发者在中国,拥有无可匹敌的电子制造能力和大规模制造业基础[2] - 人形机器人市场潜力巨大,预计未来每三年产值乘10,头部企业从1000台增长到10万台,单价几十万元可达1000亿元产值,超过工业机械臂总产值[4] - 未来10年机器人市场可能超越当前所有工业机器人量,再往后10年可能超越汽车手机市场的万亿规模[4] 技术发展与创新 - 推动机器人发展和物理AI落地需要构建三类计算机:嵌入机器人本体的计算机(如Jetson Thor)、AI工厂计算机(如DGX、HGX系统)、仿真计算机[2] - 合成数据是推动具身智能快速落地的关键,真实世界数据仅占训练数据的1%,其余99%为合成数据[3] - 人形机器人设计本质由若干关节电机串联而成,未来通用AI成熟后硬件要求会越来越低,制造人形机器人可能像组装电脑一样简单[3] - 仿真平台(如Isaac Sim)可优化机器人运动与操控能力,Isaac Lab系统实现快速策略迭代[2] - 灵巧手研发是重点,已开发约20自由度的灵巧手,目标让机器人执行日常任务而非展示性动作,未来1-2年实现自然交互[3] 企业合作与产品进展 - 宇树科技和银河通用与英伟达合作,银河通用G1 Premium人形机器人首批搭载NVIDIA Jetson Thor,在工业码垛、拆垛等场景表现优异[2] - 宇树科技新型人形机器人R1部署英伟达全栈机器人技术,通过仿真平台优化能力[2] - 宇树科技去年推出9.9万元人形机器人,今年新版本售价约3.9万元,支持外观定制,预计年底前完成量产[3] - 宇树科技发布A2机器狗,自重37千克,持续负载30千克,空载续航20公里[3] - 银河通用与英伟达合作下一代人形机器人项目,从轮式形态转向纯双足设计,基于OpenWBT_Isaac平台进行数据采集与遥控控制[3] 商业化路径与展望 - 机器人规模化部署需要顶层算力与仿真能力构建技术底座、成本可控且可量产的硬件工程、合成数据驱动的大规模训练体系[4] - AI与机器人技术将像电力与蒸汽机的发明一样,推动人类文明迈向新高度[4] - 通用机器人将成为下一个价值数万亿美元、数万亿元人民币市场的革命性产品,核心要素包括机器人本体和具身智能模型[3]