Workflow
合成数据
icon
搜索文档
银河通用王鹤最新演讲:要善于运用合成数据,加速推动人形机器人新质生产力的大规模应用
贝壳财经· 2025-07-22 10:22
行业趋势 - 2025年是人形机器人和具身智能赛道发展的关键年份,产业端不断迭代新产品,一级市场初创公司成为投资者青睐标的[1] - 具身智能是推动制造业、生产性服务业及新质生产力的关键领域[10] - 全球具身智能领域快速发展,代表性事件包括多模态大模型推出和特斯拉发布人形机器人Optimus,中国目前约有200家人形机器人和具身智能企业[11] 技术发展 - 多模态模型的下一步发展方向是将机器人动作作为输出模态,形成VLA(Vision-Language-Action)大模型,使机器人能自主理解指令并执行任务[6] - 人形机器人要具备自主决策能力需要具身大模型支持,但数据短缺是制约大规模落地的根本原因,需要上百亿数据但现有公开数据集仅百万条量级[7] - 合成数据技术可解决数据短缺问题,通过在仿真器里进行大规模强化学习来提升具身大模型的训练效率和泛化效果[8] 企业实践 - 银河通用自研仿真数据合成管线,已积累亿级真实应用场景数据及百亿级合成仿真数据,其机器人Galbot能直接将所学技能泛化到真实世界[8] - 公司推出全球首个人形机器人智慧零售解决方案,在北京已有10家门店应用,计划2025年扩展到100家药店[23] - 具身大模型还可赋能四足机器人实现商场陪伴功能,基于合成数据技术生成端到端模型实现灵巧移动[24] 行业挑战 - 人形机器人行业面临两大挑战:出货量远低于汽车行业且无法像汽车那样售出后自动回传数据[8] - 传统数据采集方法存在存量不足和效率低下问题,无法满足具身智能发展需求[19] - 当前公开数据集仅100万条,与需要的上百亿条数据相差4-5个数量级,是行业发展最大瓶颈[20] 企业成就 - 银河通用成立于2023年5月,已完成数轮融资累计24亿元人民币[25] - 公司训练出世界首个以合成数据为唯一预训练动作数据的具身基础抓取大模型GraspVLA[23] - 公司技术可实现对一个任务仅需一天下午采集数据就能在同类物品间自动泛化,大幅降低数据成本[23]
宇树科技:1到3年内机器人或许可以去流水线上打螺丝
第一财经· 2025-07-16 22:44
链博会参展企业动态 - 宇树科技首次参展链博会 展出了人形机器人G1和Go2机器人两款明星产品 产品需通过遥控器操作并支持二次开发[1] - 英伟达首次参展链博会 展台展出了Omniverse Cosmos Mega等解决方案 Mega方案支持大规模场景中仿真复杂机器人[2] - 英伟达自动驾驶业务展出了辅助系统 安全系统和智能硬件相关成果 辅助系统可通过传感器渲染极端场景帮助厂商训练[3] 机器人行业发展 - 宇树科技工作人员表示 未来1到3年机器人可能从单一工业产品发展到复合化工业场景 3到10年可能进入生活场景如家务 老人护理等[2] - 机器人未来发展需解决电池续航 材料 自重 成本控制等多重问题[2] 自动驾驶技术进展 - 英伟达相关负责人表示 自动驾驶训练需要大量数据 但厂商常缺乏真实事故和突发情况数据样本[3] - 合成数据在自动驾驶训练中具有成本和扩展性优势[3] - 英伟达考虑与中国合作伙伴共同推动汽车供应链和行业发展[4]
实探链博会:英伟达、宇树首次参会,机器人展台受关注
第一财经· 2025-07-16 21:20
链博会机器人产品展示 - 宇树科技首次参展 展出人形机器人G1和Go2两款明星产品 产品需通过遥控器操作且需二次开发才能实现搬运等功能 [1] - 宇树科技参展目的是了解上下游供应链关系并收集市场反馈以完善微型机器人产品 [1] - 英伟达首次参展 展台展出机器人 自动驾驶 云计算等关键业务 包括Omniverse Cosmos Mega等解决方案 Mega方案支持大规模场景中仿真复杂机器人及传感器 [4] 机器人行业发展前景 - 行业认为未来1到3年机器人可从单一工业场景拓展至复合工业场景 如搬运后切换功能至流水线作业 [4] - 未来3到10年机器人或进入生活场景 如家务 养老等 需解决电池续航 材料 自重 成本等问题 [4] 自动驾驶技术进展 - 英伟达展出自动驾驶辅助系统 安全系统及智能硬件 通过合成数据解决厂商真实数据不足问题 合成数据具有成本及扩展性优势 [5] - 英伟达表示智能硬件与链博会主题契合 正探索与中国合作伙伴共同推动汽车供应链及行业发展 [5]
ICML spotlight | 一种会「进化」的合成数据!无需上传隐私,也能生成高质量垂域数据
机器之心· 2025-07-11 17:22
数据短缺问题 - 公共数据产生速度预计到2028年将赶不上大模型训练的消耗速度而被耗尽[1] - 医疗、工业制造等特殊领域可用数据原本就少,数据短缺问题更严重[1] 现有解决方案的局限性 - 垂直领域中小企业倾向于使用现成大模型API,但无法直接合成垂域数据[4][5] - 大模型生成的数据与垂域实际数据存在巨大差距,无法满足垂域特性需求[7][8] - 垂域数据因隐私、知识产权等原因不能上传,增加了prompt工程难度[9] PCEvolve框架核心创新 - 只需少量标注样本即可在保护隐私同时进化出整个数据集[2] - 采用类似达尔文进化论的迭代进化框架:生成候选数据→选择淘汰→下一轮进化[11] - 设计基于指数机制的新型隐私保护方法,适配垂域少样本场景[11] 技术实现细节 - 利用开源Encoder基座模型将数据映射到特征空间计算距离[16] - 通过寻找聚类中心代表标签所有私有数据来降低计算成本[16] - 提出相似度度量h(d_s^c,D_p)来优化合成数据与垂域数据的绝对距离[18] 实验验证结果 - 在COVIDx数据集上精度达64.04%,相比初始49.34%提升显著[23] - 在Came17数据集上精度达69.10%,相比初始50.47%提升显著[23] - 在KVASIR-f和MVAD-l数据集上也分别达到50.95%和59.26%的精度[23]
银河通用创始人王鹤勾勒人形机器人产业新图景,合成数据破局具身智能落地
新浪证券· 2025-06-28 17:03
行业动态 - "具赋新能 智驱未来"青年科学家成果转化暨具身智能高质量发展研修会在上海智能工业中心开幕,百余位全球青年科学家与逾130位上市公司企业家参会 [1] - 具身智能作为让机器人具备理解物理世界并与之交互能力的尖端领域,近年来风头正劲,尤其在多模态大模型加持下,"端到端"的技术路线被视为通向"通用"的曙光 [3] - 具身智能的任务范畴比自动驾驶更广、所需数据量级更大、技术复杂度更高,但"端到端"之路依然值得坚持 [3] 技术突破 - 银河通用通过构建庞大的仿真合成数据集,生成海量虚拟操作轨迹与标签,攻克"仿真-真实"差距难题,打造出基于合成大数据预训练的端到端具身大模型 [5] - "GraspVLA"模型是全球首个完全依靠合成数据(10亿帧)预训练的视觉-语言-动作(VLA)大模型,在仿真环境中模拟了桌面场景下对近百万种物体的抓取 [7] - 模型能在完全未见过的真实环境与物体中仅凭语言指令就完成精准抓取,具备闭环实时动态调整能力和强抗干扰性 [7] - 合成数据方案带来革命性效率提升:仅需每人约2小时采集的200条真实数据微调,模型即可精确理解人类意图,并能零样本泛化到同类新物品 [9][10] 商业化应用 - 银河通用落地全球首个人形机器人智慧零售解决方案,由具身大模型机器人Galbot在实体门店中执行取货、送货、打包、库存管理等无人值守工作 [14] - 新门店部署仅需两天,无需数据采集,北京已有10家类似药店成功运行,并获100家药店订单,计划在北上广深快速部署至百家 [15] - 饮品店、咖啡店已投入运营,单日约400多单,失败率控制在极低的单日≤1单 [15] - 工业领域应用包括:国际车厂北京工厂的复杂零部件分拣任务,处理3x3x3复杂垛型的料箱搬运工作 [15] 数据挑战 - 全球最大具身智能数据集仅达百万条级别,与自动驾驶的单日数据量(头部车企单日可回流高达1亿条片段)相比相差数个量级 [4] - 人形机器人公司今年量产目标仅定在"超过1000台",离"一万台"仍有距离,与汽车百万级保有量相差两个数量级 [4] - 机器人的自由度(单臂6-7个,全身50-100个)远超汽车,意味着对数据的需求成倍增长,采集成本高昂(单人单日约采1000条) [4]
这波AI淘金热里,卖“铲子”的公司正闷声发财,“征服"了几十家国内外巨头!
AI前线· 2025-06-27 12:58
合成数据赛道底层逻辑 - AI快速爆发带来数据需求缺口 合成数据是填补这一缺口的关键解决方案[1] - 大语言模型领域不存在外部合成数据机会 因其自身具备强大数据生成能力[1] - AI向物理世界拓展为外部公司创造了合成数据供应机会[1] 光轮智能业务定位 - 专注于为具身智能行业提供3D合成数据 具备物理交互真实性、人类示范在环、场景丰富三大特征[1] - 服务对象覆盖国内外头部具身智能企业和主机厂 包括英伟达、Figure AI、DeepMind、比亚迪等数十家公司[1] - 以自动驾驶为切入点 提供城市导航辅助驾驶长尾数据解决方案 助推中国自主品牌出海[5] 商业化进展 - 成立两三个月内即实现产品商业化落地 完成与全球头部主机厂及Tier1供应商的签约交付[5] - 成立数月便完成多轮数千万级融资 融资进程顺利[3] - 2024下半年合成数据行业拐点比预期提前 Meta计划150亿美元入股Scale AI显示行业热度[4] 技术优势 - 具身合成数据需满足四大条件:物理交互真实、专家示范在环、场景丰富、数据闭环验证[8] - 实现物理级别仿真技术突破 注重数据在物理与视觉层面的双重真实性[8][9] - 建立"人类专家示范"机制 通过合成技术放大专家数据价值 填补99%具身预训练数据缺口[9][10] - 具备生成百万级差异化场景能力 解决传统数据采集方式覆盖有限的痛点[11] - 与英伟达合作实现GR00T N1模型在汽车生产线的Sim2Real落地验证[12] 商业模式创新 - 采用"卖数据"模式 提供标准化可复用合成数据服务 形成稳定现金流[15][16] - 避免大厂内部闭环局限 通过服务多元客户建立认知规模效应[13] - 聚焦具体可落地的细分需求 选择技术可实现、商业价值闭环的精准方向[13] AI创业趋势 - AI领域呈现"赢者通吃"态势 创业者需重构生存逻辑[15] - 成功关键在于:聚焦具体商业场景 建立自身数据闭环防御大模型迭代冲击[15] - 定位为AGI时代基础设施供应商 类比淘金热中的"卖水人"商业模式[16]
模型训练最重要的依然是 Scaling —— 对话阿里通义千问 Qwen 多语言负责人杨宝嵩 | Open AGI Forum
AI科技大本营· 2025-06-25 14:49
通义千问多语言战略 - 通义千问(Qwen)从项目启动就将国际化作为核心战略,优先考虑多语言数据优化以服务全球用户[2][9] - 模型支持全球119种语言,在Hugging Face平台下载量位居前列,衍生模型数超过10万个[2][6] - 英语社区用户量最大,中文用户仅排第三或第四,体现其国际化影响力[8][9] 多语言技术突破 - 建立覆盖上千细粒度分类的文化标注体系,解决不同语言文化禁忌与安全合规问题[3][13] - 采用"英语内部推理+目标语言输出"的折中方案应对多语言混杂难题,提升小语种稳定性[16] - 通过数据合成与人工审核结合提升低资源语言数据质量,文化对齐投入占研发重要比重[14][16] 模型能力演进方向 - 提出"知识密度"概念,4B参数小模型性能已超越早期70B大模型,反映数据质量优化成效[19][20] - 持续探索Scaling Law延续路径,重点布局合成数据两大方向:创造新知识与提升数据纯度[21][22] - 针对"数据回流"现象采取混合比例控制,保留人类数据多样性避免模型风格趋同[25] 产品生态布局 - 采取大小模型并行策略,4B级小模型适配终端设备部署需求,已应用于车载、穿戴设备场景[26][28] - 与硬件厂商合作开发Mobile-Agent系统,实现视觉操作手机等基础功能,复杂场景仍需技术突破[30][31] - 规划将语音翻译、文字识别等能力深度集成至操作系统,但涉及安全的核心功能保持审慎[32][34] 行业趋势展望 - 多语言技术面临三大挑战:文化多样性对齐、小语种生成流畅度、多模态融合[39][41][43] - 合成数据与跨模态迁移被视为解决小语种数据匮乏的关键路径,需社区共建高质量数据集[42][45] - AI技术替代催生新职业形态,如AI编程师、Prompt工程师等协同型岗位将成就业增长点[37][38]
具身机器人赛道融资多热?宁德时代领投11亿创纪录|热财经
搜狐财经· 2025-06-24 20:26
融资情况 - 北京银河通用机器人有限公司成立仅2年累计融资超24亿元 包括11亿元新一轮融资(宁德时代及溥泉资本领投) 7亿元天使轮融资 5亿元战略轮融资 [1] - 具身机器人赛道融资活跃 智元机器人B轮融资后估值达150亿元 宇树科技C轮融资7亿元后估值120亿元 [9] - 行业多家初创企业获融资 优理奇智能 加速进化融资超亿元 傲意科技 智在无界等融资数千万元 [9] 产品与技术 - 首代具身大模型机器人Galbot(G1)身高173cm 体重85kg 采用双臂 折叠 轮式底盘结构 可执行清理桌面 货架取货等任务 [3] - 合成数据技术是关键突破 实现90%以上抓取成功率 支持5000种商品 6000货道的自动化操作 [6][8] - 三维合成数据克服二维视觉模型泛化难题 不受光照 纹理等因素影响 可大规模生成测试数据 [8] 商业化进展 - 2024年计划在全国开设百家机器人零售店 目前北京已有近十家门店实现常态化运营 [1][6] - 50平方米无人店铺内实现24小时全流程自动化 涵盖盘点 补货 取送 打包等环节 [6] - 目标场景包括工业物流料箱运转 药店零售取货送货等 工业分拣潜在出货量达数十万台 [6][8] 行业动态 - 具身智能赛道融资热潮涌现 医疗机器人(术之道 柳叶刀等) 工业机器人(欣奕华 天太等)均获大额融资 [9] - 被投企业展开产业链布局 银河通用联合博原资本成立博银合创 智元机器人参股灵初智能等公司 [10] - 行业竞争加剧 企业普遍认可技术迭代过程中的优胜劣汰机制 [12]
英伟达(NVDA.US)加持AI制药革命 SandboxAQ合成数据破解药物筛选难题
智通财经网· 2025-06-18 21:46
公司动态 - SandboxAQ是由谷歌母公司Alphabet分拆、获英伟达战略支持的AI初创企业,已累计融资近10亿美元 [1] - 公司于6月18日正式发布大规模合成数据集,旨在通过模拟药物分子与蛋白质的相互作用机制加速新药研发 [1] - 公司独创性地将计算化学与人工智能深度融合,基于英伟达高性能芯片构建算法平台 [1] - 公司生成了520万个尚未在现实世界观测到的三维分子结构,这些"虚拟分子"严格遵循物理定律推导 [1] - 公司采取"数据开源+模型收费"的混合商业模式,免费开放合成数据集供学术机构使用,但对AI预测模型进行商业化运作 [2] 技术突破 - 公司技术平台通过求解量子力学方程生成虚拟分子结构,在数字世界搭建庞大的分子图书馆 [1] - 相较于传统计算机辅助药物设计,新发布的合成数据集可将预测效率提升数个量级 [2] - 预测结果与真实生物实验的吻合度已达到实验室标准 [2] - 技术可将传统需要数年的分子筛选周期压缩至数周,显著降低新药开发的时间与资金成本 [2] 行业影响 - 该技术解决了药物研发领域数十年的核心痛点,能快速筛选出理论上具备结合潜力的候选分子 [2] - 创新范式正在重塑药物研发的早期阶段,特别是在肿瘤治疗等领域的应用潜力巨大 [2] - 随着生物医药行业对AI制药投入持续升温,公司试图在万亿级医药研发市场中开辟全新赛道 [2]
热捧与嘲讽交织中 人形机器人公司“顶流”摸索短期出路
南方都市报· 2025-06-09 22:08
人形机器人行业现状 - 宇树科技创始人王兴兴成为北京智源大会"顶流",受到观众热捧但也面临质疑,公司被调侃为"CG动画公司",其人形机器人被称为"遥控玩具"[1] - 深圳众擎机器人同样因"炫技"视频被归入"影视公司"行列,创始人赵同阳表示不回避外界质疑,甚至将负面评价展示给工程师看[1] - 行业面临的核心争议包括"花拳绣腿"是否有意义、汽车产线落地是否过早、具身智能数据短缺如何解决[1] "炫技"的商业价值 - 由于具身智能研究尚处早期,硬件和运动控制优势的公司选择将"炫技"作为现阶段传播卖点[2] - 众擎机器人宣布将于12月举办全尺寸人形机器人格斗赛事,并计划推出1.8-2米新款机器人[4] - 松延动力因半程马拉松表演已卖出超2000台机器人,合同销售额过亿元,客户主要来自科研教育和展览展示领域[5] 汽车产线应用探索 - 优必选与多家汽车厂商合作,20多台Walker S机器人已"入职"东风柳汽生产线[6] - 银河通用与极氪、现代汽车达成合作,现代汽车付费请其进行概念验证[8] - 天奇股份与优必选、银河通用成立合资公司,已在数家整车厂、电池厂完成定制化应用场景验证[8] 汽车产线应用挑战 - 人形机器人在汽车车间面临技术成熟度不足和成本过高问题,裸机价格达50万,而工厂可接受价格约为20万[9] - 巨一科技认为物料分拣和输送是最易切入的场景,但机器人适应不同工况和数据迁移仍是挑战[9] - 中兴通讯指出工业领域要求机器人成功率和稳定性高,不能需要专人"伺候"[10] 具身智能数据挑战 - 具身模型面临训练数据短缺问题,数据积累被认为是决胜点[11] - 智元等公司兴建大型数据采集场,但实采数据可能无法满足泛化需求且难以跨本体[12] - 银河通用高度依赖仿真合成数据,其GraspVLA模型基于百亿级合成数据训练[12] 商业化落地案例 - 银河通用与美团合作,机器人已在北京7家无人药店"上岗",年内将扩展至100家,可识别5000款药品[13] - 银河通用轮式双臂机器人Galbot G1售价70万元,公司认为只要低于三年人工成本70万就能打开市场[13] - 无人药房的抓放任务面临药品包装尺寸和材质差异带来的操作准确率挑战[13]