Workflow
合成数据
icon
搜索文档
干家务一小时挣1000元,具身智能时代人类新岗位
量子位· 2025-10-24 11:53
机器人行业投资与数据需求 - 机器人领域是当前人工智能最热门的领域之一,被预测将迎来其"ChatGPT时刻" [10] - 截至文章发布时,该领域的风险投资已激增至121亿美元 [10] 机器人训练数据挑战 - 机器人行业面临数据荒,缺乏现成的互联网数据集,必须从零开始在现实世界中生成训练数据 [11] - 真实数据(如通过专业设备记录人类活动或物理数据)质量高但规模有限、成本高 [12][13][14] - 合成数据(如在虚拟环境中生成)成本较低,能实现数据自由,例如NVIDIA Cosmos可生成逼真训练环境 [16] - 为兼顾真实性与规模性,行业普遍采用结合真实与合成数据的策略 [18] 数据服务市场动态 - 数据标注服务商(如Encord、Micro1、Scale AI)高价回收人类执行日常任务(如做家务)的视频作为训练素材 [7] - Encord对高技术性任务视频(如操作设备)提供的报酬最高可达每小时150美元 [19] - Micro1提供的报酬在每小时25至50美元之间 [20] - Scale AI已生成超过10万小时的训练影像 [21] - 有机器人初创公司以每小时10-20美元的报酬征集用户拍摄的家务视频 [23] - 优质数据依然短缺,市场上可购买的最大规模数据集仅约5000小时时长,远不能满足需求 [26]
巨头“抛弃”Scale AI背后:AI的竞争核心已转向“数据秩序”
证券时报网· 2025-10-22 15:46
"智能的起点不是算法,而是秩序。"徐绍煌轻声说道。在他看来,AI的真正挑战从来不在模型精度,而 在输入数据的清洁度。算力是水泥,算法是图纸,而数据就是砖块——看似普通,却决定整栋大厦的稳 固程度。 数据标注行业因此被形容为AI时代的"卖铲人"。它不直接创造智能,却支撑了智能的基础结构。英伟达 售卖算力,OpenAI售卖算法,而数据公司售卖"干净的数据"。这是一个劳动力密集又认知密集的产 业。不同于制造业追求良率,SaaS追求续费率,AI数据的核心指标是"可被审计的秩序"——即每一条数 据为何被如此标注,都有清晰、可追溯的逻辑与合规链条。 徐绍煌称之为"秩序优势"——一种可以复用、可追溯、能长期累积的能力。"规模优势是线性的,秩序 优势是复利的。"他解释道。在过去几年里,他见证了AI数据行业从"人力外包"到"数据治理"的迁移。 早期的标注公司像赛博富士康,依靠大量人工反复标注图像和文本;如今,领先企业正尝试将机器学习 反哺标注体系,通过主动学习、自动质检、对抗样本回流等方式,让人机协同达到动态平衡。"这不是 在降低成本,而是在重建秩序,"他说,"真正的效率不是更快,而是更准。" 证券时报记者 陈霞昌 2025年 ...
黄仁勋长女直播亮相,聊了具身智能
量子位· 2025-10-16 17:30
合作背景与公司定位 - 光轮智能是一家专注于仿真合成数据技术的公司,其核心目标是帮助AI更好地理解和进入物理世界,目前主要聚焦于具身智能和自动驾驶两大场景 [3] - 英伟达内部多个项目(如Gear Lab的通用智能体模型构建、西雅图机器人实验室的接触操作和精密装配任务)都依赖于光轮智能的支持 [6] - 光轮智能成立于2023年,旨在利用合成数据和仿真来突破机器人数据瓶颈,初期从自动驾驶合成数据问题切入,后合作扩展至英伟达多个团队 [9][10] 核心挑战与解决方案 - 机器人领域面临数据匮乏问题,无法像语言模型那样利用互联网数据,必须手动采集,仿真和合成数据工厂被视为解决方案 [8] - 机器人从虚拟到现实(Sim2Real)的核心挑战在于物理准确性,例如开门时的磁吸力、拉抽屉时的摩擦力等精确物理特性 [12][13] - 高质量数据是机器人训练系统和生成正确算法的关键,合成数据被认为是解决具身智能数据瓶颈最重要、最主要的数据来源 [15][19] - 现实世界中机器人数量有限(如工厂、家庭环境),而自动驾驶有大量汽车在道路上运行,凸显了合成数据的必要性 [18] 技术平台与研发重点 - 英伟达与光轮智能正共同开发Isaac Lab Arena,这是一个用于基准测试、评估、数据收集和大规模强化学习的下一代开源框架和平台 [7][28] - 为实现高效的大规模强化学习,需确保仿真在计算上高效,例如使用基本几何体和凸包进行碰撞检测以节省计算资源 [21] - 电缆仿真是技术难点,光轮智能与Newton及英伟达合作为电缆构建求解器,并研发仿真就绪资产 [22][23] - 光轮智能与英伟达Isaac Sim实验室合作,共同攻克仿真到现实的迁移挑战,例如教机器人利用工具完成特定操作(如切割黄瓜) [25][26][28] 关键人物背景 - 光轮智能CEO谢晨曾是英伟达自动驾驶仿真负责人 [11] - 英伟达Omniverse与物理AI高级总监Madison Huang(黄仁勋女儿)负责相关领域 [1][32] - 英伟达机器人产品线经理Spencer Huang(黄仁勋儿子)负责开发用于机器人的AI模型与仿真软件 [36][37]
清华邓志东:“世界模型智能体”重塑智驾格局,算力竞赛已开启
新京报· 2025-09-30 15:34
技术趋势与产业化 - 智能驾驶技术成熟度迎来质变,世界模型智能体技术正重塑智能网联汽车竞争格局并拥有清晰产业化路径[1] - 世界模型智能体方案是未来方向,特斯拉FSD V13.2和华为ADS 4.0均已实现量产和商业化发展[1] - 自动驾驶安全性超越人类需要AI学习里程达到人类司机的上千倍[1] 数据与仿真技术 - 利用数字孪生技术生成海量合成数据是解决实车路测成本高、周期长的关键破局点[1] - 能提供高质量仿真平台与数据服务的公司在未来产业链中更具价值[1] 算力需求与竞争 - 行业正经历云端与车端同时进行的算力军备竞赛[2] - 云端预训练和构建世界模型可能需要数十万张AI加速卡和数十个EFLOPS级别算力,形成高资金技术壁垒[2] - 车端芯片算力需求正从最高500-600 TOPS向2500 TOPS以上迈进,以实现低成本、低延迟、高效能的实时响应[2] - 算力竞赛考验企业在芯片设计、架构创新与系统整合上的综合实力[2]
撞墙的不是Scaling Laws,是AGI。
自动驾驶之心· 2025-09-29 07:33
文章核心观点 - Scaling Laws本身并未失效,其是数据结构的内在属性,当前大模型发展的瓶颈在于训练数据的质量和分布,而非计算规模本身[1][7][14] - 互联网原始数据总量虽大,但针对特定任务的有效数据分布稀疏,且不同Token的价值不均等,导致模型通用智能发展受限[4][8][15] - 行业趋势正从追求通用大模型转向专注于高价值领域的专业化模型,通过使用合成数据提升数据密度,可在减小模型尺寸的同时显著提升特定领域能力[10][11][12] 数据与Scaling Laws的关系 - Scaling Laws反映了数据结构的内在属性,基于Transformer的下一词预测复杂度随计算量和参数数量呈对数线性下降[3][4][14] - 原始互联网数据混合体并非实现AGI的最佳数据分布,模型训练为每个Token投入的计算量相同,但不同Token的价值并不相等[4][15] - 通过改变预训练数据的幂律分布,例如均衡每个Token的智能含量,可以从根本上改进Scaling Laws[15] 大模型发展现状与趋势 - GPT-4级别的模型已基本消耗完互联网可用数据,其涌现的智能主要是基础的语言智能,而非行业专业知识[9] - 从Claude Opus 3开始,通过引入合成数据,模型的专业能力(如代码能力)得到增强,同时模型行为更具可控性[10] - 模型发展呈现专业化趋势,例如Sonnet 3.5相比Sonnet 3模型尺寸更小,但因合成数据密度更高,其在代码方面的能力更强[11] - GPT-5体现了极致专业化,模型尺寸减小、专业性增强,但通用聊天能力被削弱,这引发了用户争议[12] 行业驱动因素与影响 - 模型厂商面临成本压力,将逐渐放弃通用性和超大模型路线,将智能资源集中堆叠于高价值领域[7][12] - 高价值领域如编程和搜索市场规模巨大,搜索领域可能催生两万亿美元的估值预期[12] - 高密度合成数据结合强化学习,能显著提升模型在特定行业的模式匹配能力和自动化水平,但全球上千个行业中,仅有少数像编程和搜索这样具有足够高价值来吸引AI公司投入[12] - 当前“你喂我吃”的深度学习范式下,单个语言模型通向AGI的道路天然受到成本限制,对全球的影响力可能有限[12]
复旦大学窦德景解读中国AI发展:加强场景应用引导 在数据可信领域强化竞争力
上海证券报· 2025-09-25 03:46
AI技术突破的核心逻辑 - AI技术要实现突破必须扎根具体场景,以解决实际问题为核心[4] - 中国AI发展需要技术与场景深度耦合,让技术真正解决产业问题[4] - AI竞争的本质是人才竞争,需要培养既懂技术又懂场景的复合型人才[8] AI发展三要素的优化策略 - 在资源有限条件下应采用"长板补短板"策略:算力不足就优化算法,数据有限就提升数据质量[5] - DeepSeek大模型用约1/3的参数量和更少算力达到与GPT-4相近性能,证明算法优化能提升模型效率[5] - 通过算法优化、大规模强化学习、混合专家模型架构设计和多头注意力机制创新可打破"唯参数论"桎梏[5] 数据质量的重要性与挑战 - 数据质量直接决定AI模型价值,高质量数据筛选成本高昂[6] - 某案例显示5人团队花费2周时间筛选1680条数据,而模型训练仅需不到2张A10 GPU卡[6] - 通过数据隔离技术可在不泄露原始数据前提下实现模型训练与微调,满足医院和金融数据保密要求[7] 中国AI产业的发展机遇 - 中国拥有丰富的应用场景和庞大市场需求,从政务服务到工业制造、医疗健康到文旅消费[8] - 中国AI需要在基础研究与应用创新两端发力:基础层聚焦算法优化和算力适配,应用层坚持"场景为王"[8] - 应避免盲目追求大模型参数规模,通过垂类开发让AI真正融入产业流程[8] AI技术未来发展趋势 - AI将从"生成式"向"智能体"演进,最终走向"物理AI"(具身智能)[9] - 生成式AI阶段已通过简单版图灵测试,下一步是让软件或硬件智能体自主完成复杂任务[9] - 未来的物理AI将实现机器人与人类深度协作,在危险救援、精密制造等领域发挥作用[9]
机器人北京上学记
经济观察报· 2025-09-21 12:57
文章核心观点 - 具身智能的发展高度依赖高质量、多模态数据的采集与训练,这与依赖纯文本数据的大语言模型有本质区别 [1][5] - 数据已成为具身智能领域的核心生产要素和关键竞争壁垒,具有明确的经济价值,可被交易、获得补贴并成为企业融资的重要筹码 [5][9] - 北京正通过政策支持、场景开放和机制创新,系统性推动具身智能产业链发展,将整个城区打造为真实数据工厂 [5][13][17] - 行业在数据采集的技术路径上出现分化,主要围绕真机数据采集与合成数据两种路线展开,两者呈现互补趋势 [29][31] 具身智能数据采集的现状与规模 - 北京已形成多个数据采集中心,包括智源研究院、银河通用、北京人形机器人创新中心、星海图与千寻智能等,规模从三四十人到上百人不等 [4] - 千寻智能每天能采集上千条动作数据,按月形成可调用、可组合、可复用的能力库,训练效率相比过去提升近七成,新动作训练所需数据从六七百条降至不到百条 [7] - 北京人形机器人创新中心实现月均超过1万小时的动作数据采集,跻身全国采集中心第一梯队,重点关注数据质量与组织方式而非单纯总量 [8] - 星海图科技发布国内首个开放场景真机数据集Galaxea Open-World Dataset,总时长超过500小时,涵盖234种任务、1600余种物体与58类操作技能,发布一周后下载量突破8万 [18] 数据采集的场景与方法 - 数据采集场景覆盖家庭、商业与工业环境,包括1:1复刻的厨房、客厅、超市、加油站、工厂生产线等,任务涉及开冰箱、倒茶、补货、上下货等 [4][7][8] - 采集任务分为高复用性的通用动作场景和企业定制场景,后者如为家电企业采集冷柜操作流程可能需要上千小时 [8] - 基础动作由采集员完成,复杂操作由工程师佩戴VR设备远程控制,采用"自采数据、自控硬件、自测模型"的闭环体系 [6][7] - 北京亦庄的"具身智能社会实验计划"将实景场所扩展至上千个,数据池建设目标为PB(千亿字节)级,形成动态人机协同网络 [12][13][17] 政策支持与资本投入 - 北京亦庄出台专项政策,对数据采集标杆实训场给予每场所10万元奖励,对企业高质量数据集最高提供200万元资金支持,每年发放1亿元"数据券"用于补贴数据采购 [17] - 政策机制从过去补贴机器人本体转向以数据为激励对象,鼓励企业共建公共数据生态 [17] - 千寻智能自2024年初成立以来已获得近6亿元融资,投资方包括京东、小米系、宁德时代系与中东资本 [7] - 星海图完成近15亿元融资,获得美团、今日资本领投,北京机器人基金、亦庄国投跟投;银河通用在6月完成11亿元融资,创下国内具身智能赛道最大单笔融资纪录 [20][31] 数据采集的劳动力生态 - 数据采集依赖数以千计的具身智能训练师,岗位分为动作采集员、数据审核师和算法工程师三类,形成完整训练链 [22][25] - 一线采集员月薪5000-6000元,日均采集量50-200条,熟练者可达千条;审核师年薪可达8万元;核心训练师年薪15万-20万元;算法工程师月薪起薪2万元,最高可达10万元 [25] - 采集员招聘存在隐性门槛,偏好身高160-170厘米、动作协调性强、体型标准者,入职前需通过VR适应性测试,淘汰率超过50% [24] - 远程采集系统已上线,操作者可异地控制机器人完成采集任务,降低运营成本,目前已有100多台双臂机器人投入使用 [26] 技术路径的分化与探索 - 真机数据采集路线强调在真实世界中积累通用经验,如北京人形、星海图等企业通过真实场景采集构建数据配方 [8][18][29] - 合成数据路线以银河通用为代表,采用"虚实结合"范式,用10亿级合成数据进行端到端训练,仅用200条真实数据即让机器人学会抓取饮用水并泛化至不同品牌 [29][30] - 行业普遍采用仿真数据与真机数据9:1的混合比例,以平衡成本与产出,同时探索世界模型、人类在环训练等先进范式 [31] - 京东集团高级副总裁何晓冬指出,真实场景数据能影响更远的性能问题,具身智能企业应尽快让机器人参与实际工作以积累数据飞轮 [31]
机器人北京上学记
经济观察网· 2025-09-21 11:37
具身智能数据采集布局 - 北京多家企业与机构布局数据采集中心 包括智源研究院 银河通用 北京人形机器人创新中心 星海图与千寻智能等 规模从三四十人到上百人不等[3] - 千寻智能将整层空间改造成数据工厂 配备机械臂和实时监控系统 每天能采集上千条动作数据 按月形成可调用能力库[5][6] - 北京人形机器人创新中心1:1复刻厨房 卧室 加油站等场景 月均采集超过上万小时动作数据 跻身全国第一梯队[3][7][8] 数据采集技术方法 - 基础动作由采集员完成 复杂操作由工程师佩戴VR设备远程控制 千寻智能训练效率提升近七成 新动作训练从需六七百条数据降至不到百条[6] - 采集任务分为高复用性通用动作场景和企业定制场景 某品牌冷柜标准作业流程采集需上千小时[7] - 星海图科技发布国内首个开放场景真机数据集GalaxeaOpen-WorldDataset 来自50个真实场景 总时长超500小时 涵盖234种任务 发布一周下载量突破8万[18] 资本投入与政策支持 - 千寻智能2024年初成立以来获得近6亿元融资 投资方包括京东 小米系 宁德时代系与中东资本[6] - 星海图完成近15亿元融资 获得美团 今日资本领投 北京机器人基金 亦庄国投跟投[20] - 北京亦庄出台政策对数据采集标杆实训场给予每场所10万元奖励 高质量数据集最高支持200万元 每年发放1亿元"数据券" 单个采购主体年度最高补贴不超过100万元[18] 数据采集人才体系 - 具身智能训练师分为动作采集员 数据审核师和算法工程师三类 采集员日均采集50至200条 熟练者达千条 审核师日审核上千条[22] - 采集岗月薪5000-6000元 审核岗年薪达8万元 核心训练师年薪15万-20万元 算法工程师月薪起薪2万元 最高可达10万元[22] - 采集员入职前需通过VR适应性测试 淘汰率超50% 招聘偏好身高160-170厘米 动作协调 体型标准者[21] 技术路线分化 - 真机数据采集与合成数据两种技术路线并行 银河通用采用"虚实结合"范式 用10亿级合成数据训练 仅用200条真实数据让机器人学会抓取饮用水并泛化到不同品牌[26] - 行业普遍使用仿真数据与真机数据比例约为9:1 北京人形同步构建高保真合成数据 人类视频数据等多元体系[28] - 京东集团高级副总裁何晓冬认为真机采集与合成模拟是互补组合 具身智能企业应尽快让机器人走进现实世界参与工作[28] 应用场景拓展 - 北京亦庄开展"具身智能社会实验计划" 在药房 图书馆 酒店等近百个真实采集点位构建人机协同网络 计划扩展至上千个实景场所[12][17] - 七鲜超市进行补货训练 每天采集20多个微任务 人流密集对采集作业产生干扰但环境还原度最高[14][15] - 北京人形打造国内首个基于真实场景的具身智能训练平台 计划年底前完成20余个真实场景布局 承担采集员培训与认证职能[20]
数据:99%+1%,能实现“从0到10000”——银河通用王鹤:让机器人甩掉遥控器,“睁开眼”干活
新华社· 2025-09-16 05:46
公司业务与产品 - 公司专注于研发人形机器人硬件和具身智能大模型 率先实现机器人在工业 零售等场景批量落地[2] - 公司自研机器人Galbot无需遥控 能自主干活 在机器人格斗赛等赛事上斩获佳绩[2][3] - 公司在工业场景实现流水线搬运 分拣等环节规模化应用 零售场景已在北京海淀落地10多家配备人形机器人的智慧药房 并计划年内在全国开设100家[5] - 公司机器人已开始售卖零食 咖啡等商品 全球首个城市级常态化运营人形机器人示范区落地北京[2][5] 技术路径与突破 - 公司采用端到端VLA(视觉-运动-动作一体化生成)技术路径 依靠视觉反馈闭环展现实际场景干活能力[4] - 2024年初公司以10亿级合成大数据端到端训练VLA大模型 实现跨场景移动物体抓取 6月推出端到端导航大模型使机器人拥有"听-看-懂-走"闭环运动能力[6][7] - 硬件性能需够用 好用且精度高 是拿掉遥控器的另一核心[8] - 公司通过高质量合成数据解决99%的具身智能数据需求 仅1%需真实数据采集[9] 行业现状与挑战 - 当前多数机器人依赖人工遥控 演示视频多为预编排动作序列与视频剪辑共同结果 存在泛化性不足和硬件不可靠问题[4][5] - 具身智能最大困境在于数据丰富性和准确性 而非硬件或模型[3] - 头部人形机器人厂商量产规模仅千台级别 未达万台规模 真实数据采集不具备现实可行性[9] - 未来3年可批量复制场景落地是行业生死分水岭 未来1年需实现千台到万台批量交付验证行业价值[12] 数据战略与模型 - 数据决定机器人能力下限 高质量数据需多元性 覆盖柔性物体操作和场景泛化性[9][10] - 合成数据解决0到1问题 真实遥操数据解决1到100问题 视频数据处理解决100到10000问题[9] - 模型架构虽未完全成熟但已够用 数据起决定性作用 数据足够时好模型能学得更好[11] - 生成高质量合成数据需图形学 物理仿真 物理渲染 自动动作合成管线等基础设施和核心技术积累[9] 商业化与应用前景 - 彻底解决抓取 移动 放置等简单操作泛化性问题可打开数千亿元市场 应用覆盖零售 前置仓 车厂分拣等多个场景[12] - 机器人核心功能是替代人力劳动 非展示性动作 需具备24小时工作高可靠性[5] - 智能定义为解决问题的能力 人类 动物和机器人调用能力方式不同但均体现智能[13]
机器人跨越“三重门”——具身智能创新者亲历的现实与趋势丨议事厅
新华网· 2025-09-15 11:44
行业现状与趋势 - 人形机器人赛道呈现"冰与火之歌"态势 一边是机器人进厂打工、酒店送餐、赛场踢球等火热应用场景 一边是融资超百亿但订单不过百台的商业落地困境 [1] - 投资机构从观望转向竞逐 行业格局从"人形机器人第一股"一枝独秀发展到超20家产业链企业走向IPO [1] - 具身智能面临技术路径与商业落地的十字路口 未来3年能否击穿场景将成为企业生存的关键分水岭 [1][15] 技术突破与路径 - 银河通用通过10亿级合成大数据训练端到端VLA大模型 实现机器人自主执行能力 其机器人Galbot已实现无需遥控自主干活 [5][10] - 数据质量成为具身智能发展核心瓶颈 99%能力可通过高质量合成数据实现 仅需1%真实数据辅助 但高质量数据需具备多元性和泛化性特征 [12][13] - 自变量机器人开发通用具身大模型WALL-A 采用"一脑多用"端到端技术 实现零样本泛化能力 能处理拉链变形等动态异常情况 [20][26][27] - 加速进化通过足球赛事训练机器人全自主运动能力 其"感知-决策-控制"智能系统可在0.1秒内完成判断 支撑奔跑、急停、射门等复杂动作 [39] 商业化应用进展 - 银河通用已在工业场景实现流水线搬运、分拣等环节规模化应用 在零售场景落地10多家智慧药房 并计划年内扩展至100家 [8] - 全球首个城市级人形机器人示范区落地北京 银河通用推出由机器人经营的"银河太空舱"无人超市 标志具身智能进入日常生活 [5] - 加速进化通过机器人足球赛事获得商业突破 帮助中国队首夺RoboCup成人组冠军 打破欧美国家28年垄断 [36] 技术路线分歧 - 行业分化出"运动展示派"与"实干派"两大方向 宇树科技代表运动能力展示路线 银河通用代表实际场景干活路线 [8] - 端到端模型与分层模型存在技术路线竞争 端到端模型可实现实时感知决策闭环 而分层模型存在误差累积和延迟问题 [25][26] - 自动驾驶模型无法直接迁移至机器人领域 因机器人核心难点在于复杂操作而非导航运动 [32] 成本与规模化挑战 - 人形机器人单台成本超10万元 加上维修成本更高 而工人年薪仅5-8万元 成本效益比尚未达到商业规模化要求 [42] - 头部厂商量产规模仅千台级别 未达万台规模 制约数据采集和模型迭代速度 [12] - 工业场景存在技术匹配度问题 现有专机设备已实现高度自动化 人形机器人入厂可能造成"瑞士军刀切菜"的错配现象 [43] 未来发展路径 - 未来1年实现千台到万台批量交付将成为行业价值验证关键节点 [15] - 操作系统生态构建被视为核心护城河 通过开发者生态推动软硬件快速迭代 [40] - 家庭场景被定位为终极目标 因其数据是"活"的 而工业场景数据相对固定且迁移价值有限 [43]