合成数据
搜索文档
未来智造局|“突围”具身智能数据难题
新华财经· 2025-06-06 15:18
人形机器人行业发展现状 - 人形机器人在全地形动态挑战赛、工业场景赛、家庭场景赛、商业场景赛等五大赛道28个高难度场景中表现出一定自主性,例如自主寻找和归类物品 [1] - 行业在精度、速度、泛化度等维度仍显不足,训练数据不足是主要瓶颈,特斯拉、谷歌及国内企业正通过建设训练场和数据集解决,但面临成本高、周期长问题 [1] - 合成数据技术路线已有突破,完全基于合成数据训练的具身智能大模型开始商用落地 [1] 具身智能训练数据挑战 - 具身智能训练数据稀缺,与文本数据相比数量差距可能达百万倍,多模态数据尤为缺乏 [2] - 特斯拉通过远程操作记录动作和环境数据,谷歌DeepMind联合斯坦福推出Open X-Embodiment Dataset含100多万条真实机器人轨迹,智元开源百万真机数据集AgiBot World [2] - 头部车厂每日数据回流达1亿条,但具身智能领域最大数据集仅百万条规模,数据不足导致模型训练效率低、场景适应能力弱 [3] 合成数据技术应用与局限 - 银河通用展示完全基于合成数据训练的GraspVLA大模型,采用10亿级合成数据,已应用于24小时无人药店,单店可管理5000多种药品、6000多个货道,北京6家门店常态化运营,年底计划扩展至全国100家 [4] - 合成数据生成视觉数据较成熟,但触觉、温度、声音等多模态数据生成仍存挑战,仿真与真实环境匹配度不足影响数据有效性 [5] - 行业通过"模拟到现实"迁移技术缩小模拟与物理环境差距,需引入物理规律约束以提升数据质量 [6] 异构数据互通解决方案 - 国地中心启动具身智能训练场,进驻100多台全尺寸人形机器人,探索数字与物理世界链接 [6] - 推出"格物-致知"开发平台,收集100多款机器人构型,通过仿真平台对齐异构数据并实现跨平台映射,避免基础功能重复训练 [7] - 计划在7月WAIC期间发布多项重要成果,解决行业数据互通痛点 [7]
企业级AI迈入黄金时代,企业该如何向AI“蝶变”?
搜狐财经· 2025-06-05 22:34
微软企业级AI业务进展 - 微软与巴克莱银行达成10万份Copilot许可证交易 按每位用户每月30美元计算 年化价值达数千万美元 [1] - 埃森哲 丰田汽车 大众集团和西门子等企业客户内部Copilot用户规模均突破10万量级 [1] - 微软CEO强调跟踪客户员工实际使用率 而非单纯追求销售数字 将企业级AI市场作为核心战略阵地 [1] 生成式AI企业级应用趋势 - 2025年将迎来更多企业级AI应用落地 AI与产业融合成为科技圈焦点话题 [3] - 企业级AI在HR 财务 供应链自动化 IT运维 企业资产管理等领域有广泛应用潜力 [3] - 金融 医疗 法律咨询 教培等服务型行业有望率先实现成熟生成式AI落地 [3] 企业级AI应用方式 - 嵌入软件方式简单但差异化最低 [5] - API调用具备一定差异化能力 但长期效果会减弱 [5] - 搭建企业级AI平台成为最优解 短期投入大但长期回报可观 [5][6] 企业级AI应用挑战 - 大模型"幻觉"问题制约企业级应用 对准确性安全性要求高的场景落地缓慢 [7] - 当前大模型在专业语言领域 专业视觉识别和文生视频等能力仍需技术迭代 [8] - 数据安全问题成为企业关注焦点 需加强加密 访问控制等安全措施 [8] 数据在企业级AI中的关键作用 - 高质量数据是AI时代"石油" 宝马等企业已启动数据资产化进程 [10] - 合成数据将成为大模型训练重要资源 Gartner预测2030年将取代真实数据 [11] - 数据就绪是企业应用大模型的基础和前提 需打通跨部门数据通路 [13] 企业级AI典型应用场景 - 智能客服产品迭代 降低部署成本并提升问答质量 [14] - 金融行业聚焦风险评估管理和知识图谱平台搭建 [15] - 医疗行业应用于病变识别和AI分诊助手 [15] 企业级AI规模化应用路径 - 平台化是规模化应用前提 需通过内部系统集成实现能力联动 [17][18] - AI需形成规模化应用才有价值 单场景低频应用意义有限 [16] - 未来十年AI将深度渗透生产管理服务全链条 从试验田变为生产力引擎 [18]
辛顿、杨立昆等 AI 先驱都源自信号处理——对话 IEEE 首位华人主席、美国双院院士刘国瑞 | 万有引力
AI科技大本营· 2025-06-04 13:42
行业趋势与科研模式变革 - 深度学习和大数据时代导致科研资源向工业界倾斜,大公司凭借算力和数据优势主导前沿研究[20] - 传统学术研究面临天花板,真实产品落地需工程团队支持,工业界能收集多样化真实数据推动突破[21][39] - 信号处理领域为现代AI奠定基础,Hinton、LeCun等先驱的研究多发表于信号处理期刊[27][28] 技术创新与商业化应用 - 无线感知AI通过分析环境无线电波实现无接触监测,检测跌倒准确率达95%,远超可穿戴设备25%的水平[42][43] - 技术已应用于医疗监护、汽车安全等领域,日本校车采用该技术防止儿童遗留车内事故[44] - 公司累计申请250项专利,真实场景数据驱动持续创新,学术环境难以实现同等产出[39][41] 人才培养与学术理念 - 30余年培养70余位博士/博士后,其中14人当选IEEE Fellow,20位女性学者[11][30] - 培养方法强调自主发现问题能力,博士生需发表4篇IEEE顶级期刊论文方可毕业[31] - 学术评价应注重实质贡献而非头衔,荣誉体系存在地域偏见但正逐步改善[33][34] 6G与AI未来展望 - 6G时代将实现"数字孪生"生态,个人虚拟代理可处理各类事务,依赖超高带宽实时通信[54] - AI工具普及将重塑职业结构,工程师可转向生物医药等跨学科领域创造新岗位[51] - 无线感知技术有望成为人类"第六感",改变生活方式定义[45] 创业与科研选择 - 60岁放弃终身教职全职创业,认为公司环境比学术机构更利于突破性创新[20][39] - 早期学者若选择工业界高薪路径往往难返学术界,学术道路需明确初心[19][25] - 科研模式从理论驱动转向数据驱动,合成数据仅能有限弥补真实数据不足[22][24]
【钛晨报】反对“内卷式”恶性竞争,中国汽车工业协会发布重要倡议;香港《稳定币条例》正式成为法例;特朗普称将把进口钢铁关税从25%提高至50%
钛媒体APP· 2025-06-03 07:42
新能源汽车行业 - 中国新能源汽车新车销售占比已超过40%,行业整体运行稳中向好但盈利水平下降,无序"价格战"是效益下降的重要因素[2] - 5月23日以来某车企率先大幅降价引发新一轮"价格战",加剧恶性竞争并影响产业链安全[2] - 中国汽车工业协会倡议企业遵守公平竞争原则,不以低于成本价格倾销商品,不进行虚假宣传[2][3] 自动驾驶与AI技术 - 自动驾驶领域合成数据使用比例约30%-40%,具身智能领域超过90%,具身智能全生命周期需要大量合成数据[4] - 阿里云发布通义灵码AI IDE,支持3000多款工具调用,插件下载量超1500万,蔚来等上万家企业已接入[7] - 小米汽车任命前一汽南京CTO陈光为辅助驾驶感知负责人,其曾领导L4级Robotaxi研发[8] 医药与生物科技 - 石药集团正就三项潜在交易进行磋商,涉及药品授权及合作,总金额可能达50亿美元,其中一项已进入后期阶段[6] - 美国劳伦斯伯克利国家实验室将打造由英伟达芯片驱动的新超算,预计2026年投入使用并以诺贝尔奖得主命名[13] 互联网与科技公司动态 - 百度起诉小米不正当竞争纠纷案将于6月13日开庭审理[5] - 英伟达多名高管计划减持股票,CEO黄仁勋拟减持价值超8亿美元的600万股[12] - 特斯拉在法国5月销量同比暴跌67%至721辆,创2022年7月以来新低[10][11] 政策与监管 - 香港《稳定币条例》正式生效,仅持牌机构可向零售投资者销售法币稳定币[15][16] - 三部门发文要求国企技能岗位薪酬不低于相应管理岗位,设立技能等级挂钩的专项津贴[18] - 网信办要求存储10万人以上人脸信息的处理者需向省级网信部门备案[22] 宏观经济数据 - 中国5月官方制造业PMI为49.5%,较上月上升0.5个百分点,生产指数升至50.7%临界点以上[25] - 前5月百强房企销售额14436亿元同比下降10.8%,5月单月降幅扩大至17.3%[26] - 4月汽车商品进出口总额230.9亿美元环比增6.8%,出口金额193.9亿美元同比增5.3%[27]
驱动具身智能的数据基石——光轮智能联合创始人兼总裁杨海波
财富FORTUNE· 2025-05-20 21:08
合成数据的核心作用 - 合成数据被视为推动AI技术革新的"新石油",是AI进入物理世界的桥梁[1] - 具身智能发展必须依赖合成数据,其价值在于将人类示范转化为海量训练素材[3] - 合成数据需满足四个必备条件:真实物理交互能力、人类示范在环、场景丰富度、数据闭环验证[3] 光轮智能的技术优势 - 公司通过仿真技术打造具身数据引擎,填补99%的具身Pre-Train阶段数据缺口[4] - 生成百万级差异化场景,解决Real2Real场景丰富度不足的问题,支撑算法训练[6] - 与英伟达合作实现GR00T N1模型在汽车制造生产线的Sim2Real落地,验证闭环能力[9] 商业模式创新 - 采用直接"卖数据"模式而非提供仿真工具,定位为AGI时代的"卖水人"[11] - 融合Scale AI的运营经验,构建高效具身合成数据产线,连接专家示范与仿真技术[11] - 截至2025年初服务英伟达、DeepMind、字节跳动等顶尖企业,国内市场份额第一[11] 行业前景与公司战略 - 具身智能领域合成数据份额预计达90%-99%,但需解决技术标准、物理模拟精度等挑战[13] - 公司将持续加大研发投入,加速国际化布局,目标成为全球顶尖合成数据提供商[13] - 在AI数据革命中,公司以先行者姿态引领行业发展[14] 创始人背景与理念 - 创始人杨海波拥有政府、社会组织及企业多元履历,兼具政策洞察与市场经验[2] - 创业理念为"拥抱不确定",认为仿真技术能解决实体经济具身数据积累瓶颈[2]
关于MIT博士论文造假:相信并加大质疑AI声称的最美好的东西
虎嗅· 2025-05-19 07:51
论文造假事件 - MIT博士生Aidan Toner-Rodgers因论文造假被勒令退学 论文涉及AI对经济增长的贡献 特别是企业研发与创新领域 [1][2][5] - 论文《人工智能、科学发现和产品创新》原本即将发表在顶级经济学期刊The Quarterly Journal of Economics 但被导师诺奖得主阿西莫格鲁和奥托教授请求撤稿 [2][3] - 该论文声称证明AI能显著提升研发效率 使用AI工具的科学家发现材料增加44% 专利申请增加39% 产品创新增加17% 但数据被证实造假 [30] AI在材料科学领域的应用争议 - 谷歌DeepMind使用GNoME模型预测出220万种新晶体 其中38万种结构稳定 声称相当于"近800年知识积累" [10][12] - 但化学专家分析发现这些预测材料缺乏可信性、有用性和新颖性 许多只是已知化合物的无关紧要改编 [12] - 专家指出AI生成的材料数据需要化学材料专家验证 单纯依靠算法预测缺乏实际科学价值 [12][22] 学术诚信与AI风险 - 在LLM时代 AI可以生成大量看似符合逻辑的数据集和论文 增加了学术造假风险 [24][26] - 预印本论文泛滥导致未经同行评审的研究被过度报道 媒体倾向于炒作AI的夸大说法 [25][28] - AI可能破坏科学研究范式 合成数据与真实数据的界限日益模糊 特别是在非物理世界领域 [27][28] 跨学科研究问题 - 跨学科AI研究需要多领域专家合作 单纯由单一学科背景人员完成容易产生问题 [25] - 该造假论文最大问题在于全部由经济学背景人员完成 缺乏材料科学专家参与 [25] - 未来AI+学科研究需要建立更严格的合作与评审机制 防止类似造假事件 [25][26]
ICML 2025 | 如何在合成文本数据时避免模型崩溃?
机器之心· 2025-05-14 12:36
合成数据与模型崩溃 - 生成式人工智能技术快速发展,合成数据成为大模型训练重要组成部分,未来GPT系列语言模型将依赖人工数据和合成数据混合的大规模语料 [1] - 合成数据不加控制使用可能引发"模型崩溃"问题,即便单次训练混入较多比例合成数据也会导致模型性能急剧下降,难以泛化到真实数据 [1] - 非迭代式模型崩溃现象:实验显示即使只进行一次预训练,混入高比例合成数据也会显著导致性能下降,在多个语言理解任务上得到验证 [6] 合成数据的结构性缺陷 - 合成数据相比人工数据存在两类结构性缺陷:分布覆盖收窄(缺乏低频与长尾样本)和特征过度集中(n-gram等语言特征分布密度过高) [7][13] - 这些缺陷导致难以体现语言多样性,并易使模型过拟合 [13] Token-Level Editing解决方案 - 研究团队提出Token-Level Editing方法,通过在真实数据上引入细粒度"微编辑"操作构建"半合成"数据,避免模型崩溃 [3][9] - 该方法仅针对模型"过度自信"的token进行替换,保留原始数据长尾结构,编辑规则基于条件概率估计和编辑阈值 [10][11] - 理论证明该方法测试误差存在固定上界,避免误差无界增长,实现"理论上不崩溃"的数据增强路径 [14][15][16] 实验验证结果 - 预训练阶段:在PIQA、BoolQ等通用任务上,使用编辑数据的模型表现优于纯合成数据方案,如OLMo-1B平均分提升+0.36个百分点 [18] - 持续预训练阶段:在生物医药等专业任务中带来跨域泛化提升,如PubMedQA任务准确率提升高达+13.6% [18] - 监督微调阶段:在指令理解与代码推理等复杂任务中展现强鲁棒性,如LLaMA-3平均提升+0.4~0.5% [18]
群核科技(DY1479HK):一文看懂全球空间智能独角兽
华西证券· 2025-05-12 19:13
报告公司投资评级 未提及 报告的核心观点 - 空间智能设计行业规模可观且潜力巨大,国内市场正高速增长,预计2028年全球和中国市场规模将分别突破369亿元和达到68亿元,合成数据潜在市场空间大,预计2028年国内基础数据服务市场规模近200亿元 [3][4] - 群核科技卡位空间智能服务,在国内空间设计领域独占鳌头,技术优势显著,可延伸至多生态领域,提前布局合成数据赛道,打开新增长曲线 [4] - 公司产品裂变式增长,PLG模式的“飞轮效应”加速,盈利拐点已现,收入有望快速增长,利润端将逐步释放 [4] 根据相关目录分别进行总结 图解群核科技的概况 - 业务概况:拥有多元化产品矩阵,包括空间设计与可视化平台酷家乐、进军海外市场的核心抓手Coohom、合成数据服务群核空间智能平台、面向公装商装领域的群核酷空间、提供营销数字化服务的美间等,应用于多场景 [9] - 发展历程:经历创立与初期探索、产品迭代与市场拓展、技术深化与行业赋能、生态布局与全球化四个阶段,形成全链路数字化解决方案 [10] - 创始人与重要股东:创始人与核心管理层经验丰富,三位创始人合计持股30.72%,引入了IDG、GGV等知名投资机构 [12][14] - 研发投入与用户增长:收入持续增长,规模持续扩张,2023/2024Q1 - Q3收入分别同比增长10.5%/13.8%,经调整净亏损缩减;研发投入高,费率逐步回落,产品不断升级创新,用户周活攀升 [22][26][29] 如何理解群核的竞争壁垒 - 技术壁垒:自建GPU集群驱动多场景应用,启真引擎实现真实感渲染突破,矩阵引擎实现真正一体化,AI与AIGC协同赋能,打造空间设计新范式 [32][34][38] - 生态与数据壁垒:拥有3.6亿个3D商品素材模型,是全球最大的空间设计平台,净收益留存率稳定在100%以上,平台网络效应多维显现,形成正向生态闭环 [32][57] - 商业模式壁垒:以企业与大客户为核心,打造“高留存 + 低流失”平台型商业模式,订阅收入结构呈现“高集中、强粘性”特征 [63] - 与竞品对比:酷家乐渲染效果与效率双领先,性能优势显著,形成“设计 - 渲染 - 图纸 - 报价”一体化的高效闭环 [64][67] - 竞争格局:通过覆盖全流程的数字化设计平台,在空间设计软件行业中位居第一,形成上下游广泛客户基础 [74] 群核的商业模式如何落地 - 盈利模式:通过提供多级订阅满足客户需要,构建“个人订阅 + 企业定制”双轮驱动的盈利体系,企业客户占据订阅收入大部分,个人客户订阅收入呈高速增长态势 [79][80][85] - 销售模式:采用“直销为主、第三方代理为辅”的销售模式,全球化直销网络是核心收入来源,第三方代理是补充销售方式 [88] 未来空间展望 - 空间设计软件行业:赛道扩容趋势下,当前应用场景广阔,未来应用场景多样,包括家居设计、3D可视化市场、虚拟场景融合AI技术在电商领域的应用等 [90][92][109] - 合成数据:作为新衍生赛道,潜在市场空间巨大,群核科技属于第一梯队成员,合成数据较真实数据具有超高性价比 [115][120][123] - 海外发展:酷家乐海外版Coohom服务全球超200个国家和地区,获得多个权威软件评测网站高度评价,已在10多个国家设本地团队,未来有望进一步扩大海外市场 [127][130] 本次募集用途分析 - 扩大全球版图:以美国、韩国、日本及东南亚为重点进行国际扩张,加强客户支援,开设办事处,建立合作伙伴关系 [132] - 持续优化产品及开拓新业务场景:增强产品主要功能,拓展至新垂直领域及业务场景 [132] - 扩大客户群体:调整销售团队,针对不同规模企业提供不同服务,在多渠道推广品牌 [132] - 持续进行技术投资:投资核心技术与基础设施,升级技术,探索新人工智能用例 [132]
具身空间数据技术的路线之争:合成重建VS全端生成
量子位· 2025-04-20 21:24
具身智能数据挑战 - 高质量数据是具身智能突破的关键[1] - 现实数据采集成本过高,合成数据技术成为重要解决方案[2] - 当前具身智能数据存在数量少、场景单一、语义标签粗略等问题[16][17] - 自动驾驶已建立城市级仿真数据闭环,但室内环境缺乏3D合成平台[4][18] 技术路线之争 - 两条主流技术路径:"视频合成+3D重建"与"端到端3D生成"[3] - 视频合成路线存在模态转换链路过长、误差累积、精度瓶颈等问题[24][39] - 端到端3D生成路线理论效率高但面临常识欠缺、现实合理性不足等挑战[67][69][70] - 视频合成路线代表案例:群核科技SpatialLM+SpatialVerse[28][31]、Hillbot Cosmos+Sapien[35][37] - 端到端3D生成代表方法:GNNs[49]、自回归Transformer[53][54]、扩散模型[60]、程序化生成[62] 模态编码创新方案 - 提出"模态编码"技术,将空间设计规则转化为可学习的数学结构[5][75][77] - Sengine SimHub通过强化学习嵌入行业知识,生成兼具功能性与合理性的3D场景[76][78] - 模态编码支持从户型图/功能需求到结构化3D数据的自动转译,提升语义理解能力[81] 行业现状与趋势 - 机器人运动控制能力已成熟,但环境感知与推理能力仍是短板[98] - 现有合成数据技术难以满足家庭场景的多样性与交互真实性需求[18][40] - 未来需构建支持规则嵌入、偏好吸纳、交互可控的空间数据生成体系[90][94] - 合成数据将成为具身智能迈向通用能力的关键推动力[100] 代表性研究进展 - 李飞飞团队BEHAVIOR基准基于mesh网格生成,缺乏语义标注[25][30] - ATISS利用自回归Transformer生成合理室内布局[54][57] - DiffuScene通过扩散模型生成物理合理的完整场景[60][62] - Infinigen Indoors通过程序化生成实现高可控性3D场景[62][80] - SceneTeller展示语言到3D场景的强映射能力[65][67]
阿里云前高层创办的Lepton AI,被英伟达看中了!
证券时报网· 2025-03-28 20:32
文章核心观点 全球半导体巨头英伟达即将以数亿美元估值收购人工智能初创企业Lepton AI,这是对其自身技术生态的有力补充,也将助力Lepton AI发展,同时英伟达还将收购另一家人工智能初创企业Gretel [1][4][5] Lepton AI情况 - 成立于2023年,创始人为贾扬清和Junjie Bai,约有20名员工,客户含多家风投支持的初创公司 [3] - 创立的平台针对AI工作负载优化,可用于训练AI模型和执行推理,提供可视化界面设置训练集群,有多种英伟达显卡供选择,还提供集中管理硬件数量的工具 [3] - 平台具备检测AI模型训练错误和发现技术问题的功能,模型开发完成后可部署在推理优化实例上,承诺每秒超600个令牌处理速度且延迟保持在10毫秒以下,有自动扩展功能 [3] - 使用vLLM等开源工具加快推理速度,减少模型内存占用 [4] 英伟达收购原因及影响 - 面临云服务提供商竞争压力,寻求多元化发展,通过收购小型AI初创公司推动云和软件业务发展 [4] - 收购Lepton AI是对自身技术生态的有力补充,能满足市场对AI解决方案的需求,为芯片应用开辟新道路 [4] - 让Lepton AI获得更多资源和支持,加速技术创新和市场拓展,使技术成果更快转化为实际应用 [4] 另一收购情况 - 英伟达还将收购人工智能初创企业Gretel,该企业提供创建合成数据的工具,交易价值超3.2亿美元 [5] 创始人贾扬清情况 - 是全球AI架构领域知名技术人才,毕业于清华大学和美国加州大学伯克利分校 [6] - 曾在谷歌、Facebook工作,打造的深度学习框架Caffe成为Facebook重点部署框架之一 [6] - 2019年加入阿里巴巴,2023年离职创立Lepton AI,公司同年完成天使轮融资,英伟达收购完成后,天使轮投资机构将实现退出 [7]