合成数据
搜索文档
服装行业退货率高,问题出在AI上?
虎嗅APP· 2025-12-08 18:03
文章核心观点 - 当前服装行业应用AI进行设计和营销时,面临“货不对版”、退货率高企的挑战,其根源在于AI能生成逼真图像,但无法理解布料的物理特性和复杂的制衣工艺[2][3][7] - 凌迪科技(Style3D)通过整合AI与高精度3D物理仿真技术,构建了从设计、打版到生产的全链路数字化解决方案,旨在解决行业数据碎片化问题,并重塑服装产业链[4][11][18] - Style3D积累的柔性体物理仿真能力与数据,不仅服务于服装行业,更成为未来具身智能和机器人理解并操作柔性物体的关键基础设施,具有广阔的战略前景[20][24][25] AI在纺织服装行业落地的困境与根源 - 行业生产链路漫长且碎片化,关键数据(如版型细节、工艺逻辑、面料物理表现)分散在不同软件、沟通记录及老师傅经验中,尚未形成结构化数据[5] - 服装是高度复杂的柔性体,不同面料(如丝绸、牛仔、羊毛)在不同力学作用下表现迥异,而当前AI生成的设计图常违背物理规律(如裙摆违背重力、接缝无法生产),导致“好看,不等于能做”[7] - 行业缺乏标准化、高质量的柔性数据来训练AI模型,与互联网、金融等拥有标准化数据的行业不同,仅靠人工标注的图片和文字信息无法满足模型训练需求[8][9] Style3D的解决方案:AI+3D打通研发与生产 - **设计环节**:利用AI多模态生成模型,设计师通过输入语言描述、手稿或参考图,可快速生成符合物理规律和穿着需求的效果图,提升创意转化效率[13] - **制版与生产环节**:将AI生成的效果图拆解为2D版图,并通过自研的物理仿真引擎生成可直接用于生产的“3D数字样衣”,精确计算出版型尺寸、面料克重、弹力、悬垂感及缝线走向[13][14] - **协同与降本**:设计、打版、生产在同一数字化平台无缝衔接,品牌与工厂可在虚拟环境中完成确认,大幅减少样衣往返、沟通误差带来的时间和成本[16] - **营销与预售**:基于高精度3D数字样衣,可自动生成适用于各渠道的高保真视觉素材,并开启预售,确保最终成衣与数字样衣高度一致,缩短研发周期,降低库存风险[16][18] Style3D的底层能力与战略价值 - **核心技术**:自研高精度柔性体物理仿真引擎,专注于模拟布料在重力、摩擦力、风力及与人模交互下的复杂物理特性(如弹性、摩擦、拉伸、折叠)[22] - **数据积累**:用10年时间积累了几十万种面料及服装数据,能生成精准反映物理属性的结构化数据,为模型训练提供高质量燃料[23] - **构建闭环**:建立Real2Sim2Real(从现实到虚拟再回到现实)闭环,从真实工序提取布料物理属性,在虚拟环境中训练机械臂进行千万次抓取、折叠等练习,再将优化策略反馈给真实生产线机器人[24] - **突破数据瓶颈**:通过高精度仿真,能以指数级速度生成与迭代合成数据,解决了在真实世界采集训练数据成本高、效率低的瓶颈,为机器人学习提供“虚拟燃料”[24][25] - **行业地位**:作为全球少数掌握高精度物理仿真能力的玩家,已入驻英伟达Newton物理引擎平台,并成为该平台全球唯一的形变体模拟引擎公司[9][25]
英伟达4B小模型击败GPT-5 Pro,成本仅1/36
36氪· 2025-12-08 15:23
核心观点 - 英伟达团队开发的4B小模型NVARC在ARC-AGI 2竞赛中以27.64%的公开榜成绩超越GPT-5 Pro的18.3%登顶榜首,其单任务成本仅20美分,约为GPT-5 Pro成本(超过7美元)的1/36,展现出小模型在特定任务上卓越的性价比和性能优势 [1] - 该成就的关键在于采用了零预训练深度学习方法,规避了传统大规模预训练模型的领域偏见和数据依赖问题,并通过创新的合成数据生成与优化策略,在计算资源受限的竞赛环境中实现了高效推理 [3][8] 技术方法与策略 - 团队策略是将复杂的推理工作转移至离线的合成数据管道进行,训练能够在评估时快速运行的较小模型,而非依赖参数堆叠 [8] - 由于Kaggle比赛对计算资源限制严格,团队利用GPT-OSS-120B等大型模型在离线阶段大规模制作高质量的合成谜题,以规避在线推理的高昂算力成本 [10] - 为确保合成数据质量,团队将复杂推理管线拆分为可独立验证的不同阶段,最终建立了一个包含超过325万增强样本的合成数据集,其中每个样本最多有7对输入/输出 [11][12] 模型架构与训练 - NVARC核心推理模块基于改进的ARChitects方法,选用小参数模型Qwen3-4B,并通过对话式模板简化谜题理解 [14] - 训练借助NeMo RL框架和Megatron后端进行监督微调,但取得优异成绩的关键在于测试时微调技术 [14] - 针对ARC-AGI 2“每个任务都是全新规则”的特点,NVARC为每个问题引入LoRA微调技术,使模型在解题前能快速适应,并对解码阶段的DFS算法进行了批处理优化,统一了8种数据增强操作来评估候选解 [14] 数据合成与规模 - 团队从H-ARC、BARC等数据集中搜集现有ARC谜题,并通过混合简单谜题生成更复杂的新谜题来扩充数据 [13] - 构建的合成数据集规模庞大,其中来自NVARC full的数据源贡献了约178.6万个样本,占总样本数325.5万的54.9% [12] - 该方法强调了合成数据规模扩展的重要性,与Scaling Law的理念相呼应 [12] 行业意义与启示 - 在特定领域任务中,经过针对性优化的小模型在性能上可媲美甚至超越全面发力的大模型,并具备成本、速度、适配性与领域聚焦等多重优势 [16] - 该案例表明,将正确的方法应用于正确的场景能实现更大价值,模型设计应趋向“敏捷”,以在特定场景中发挥最大效能 [16][17]
英伟达4B小模型击败GPT-5 Pro!成本仅1/36
量子位· 2025-12-08 14:07
文章核心观点 - 英伟达团队开发的4B小模型NVARC在ARC-AGI 2竞赛中以27.64%的成绩超越GPT-5 Pro的18.3%,登顶榜首,其单任务成本仅约20美分,远低于GPT-5 Pro的超过7美元,展现出小模型在特定领域通过方法创新实现高性能与高性价比的潜力 [1][2][4] 竞赛成绩与成本优势 - NVARC在ARC-AGI 2公开榜的成绩为27.64%,显著高于GPT-5 Pro的18.3% [2] - NVARC每任务成本仅约20美分,大约是GPT-5 Pro单任务成本(超过7美元)的1/36,成本优势巨大 [4] 技术路径:零预训练与合成数据 - NVARC采用零预训练深度学习方法,不依赖大规模通用数据集进行前期预训练,规避了预训练模型的领域偏见和数据依赖问题 [5] - 团队将复杂推理移至离线的合成数据管道,通过大规模合成高质量数据来训练较小的模型 [9][10] - 具体方法包括利用GPT-OSS-120B等大型模型大规模制作高质量的合成谜题,并将简单谜题混合生成更复杂的新谜题 [14][15] - 通过分阶段独立验证的复杂推理管线,团队建立了一个包含超过320万增强样本的合成数据集,其中每个样本最多有7对输入/输出 [17][18] - 合成数据集的构建详情如下表所示,最终NVARC full部分包含约178.6万个样本,占总样本数(约325.5万)的54.9% [19] 模型架构与训练方法 - 模型核心推理模块基于改进版ARChitects方法,选用小参数模型Qwen3-4B,并通过对话式模板简化谜题理解 [19] - 训练时借助NeMo RL框架和Megatron后端进行监督微调 [20] - 针对ARC-AGI 2“每个任务都是全新规则”的特点,引入了针对每个问题进行测试时微调(TTFT)的LoRA微调技术,让模型在解题前快速适应 [21] - 对ARChitects方法的改进包括在解码阶段对DFS算法进行批处理优化,修复结果非确定性问题,并统一了8种数据增强操作来评估候选解 [22][23] 方法论的启示与行业意义 - 在特定领域任务中,经过针对性优化的小模型性能不逊色于大模型,并具备成本、速度、适配性与领域聚焦的优势 [25] - 将正确的方法用在正确的地方,可以实现更大的价值,这提示行业关注方法创新而非单纯追求模型参数规模 [25]
专访|“北欧之眼”基金创始人拉斯·特维德:人工智能泡沫可能在未来两三年出现
搜狐财经· 2025-12-08 12:56
全球AI投资热潮与现状评估 - 全球资本市场正经历以人工智能为核心的新一轮科技投资热潮 科技投资以罕见强度重塑增长结构 在传统行业承压背景下 科技部门以高强度资本开支扮演了类财政刺激角色 [1] - 当前AI相关投资约占全球GDP的2% 仍处于绝对合理的区间 远低于历史上如19世纪铁路热潮时期的泡沫水平 [1][5] - 市场对流动性收缩的敏感度下降 估值扩张呈现典型泡沫动力学特征 但短期内不需要担心AI有泡沫 泡沫可能会在未来两三年内出现 [1][8] AI技术发展路径与未来潜力 - AI处理成本每年下降90%左右 计算效能每3、4个月翻一番 远超摩尔定律的速度 [4] - AI工具平台WalkingFace上的模型数量已达220万 每过5至6个月就翻倍 [4] - 2024年至2028年将是人类史上最惊心动魄的技术爆发期 AI的进步在2018至2020年间已出现自我改进的雏形 这种能力正在指数级增长 [4] - 仅以当前可见的商业模式来评判AI未来的经济潜力是一个巨大的误判 未来几年局面将截然不同 [1][10] AI行业市场供需与公司风险 - 核心资源供不应求 英伟达和AMD的芯片产能无法满足市场需求 数据中心满负荷运转 这与互联网泡沫时期的光纤产能过剩完全相反 [5] - 微软、谷歌等公司的AI支出接近其强大的自由现金流 资金充足 发债更多出于财务优化而非生存需要 [6] - 唯一风险较高的是像OpenAI这类缺乏多元现金流的公司 [6] - 当前企业盈利强劲增长 同时利率在下降 这是一个非常有利的宏观环境 与2000年互联网泡沫破裂前的情景不同 [6] AI商业模式演进与护城河构建 - 未来AI公司不能只依赖大模型 而是需构建护城河 例如打造垂直行业AI操作系统 建立拥有数据围墙花园的私有云部署或生成式工作流系统 [9] - 个人AI将是关键方向 它存在于个人设备中 通过长期学习用户习惯形成不可替代的助手 [10] - 顶尖企业的团队已意识到这些趋势且在积极布局 [10] AI技术发展的数据与算法路径 - 关于大模型数据耗尽的观点 未来模型将更多依赖由AI自身生成的合成数据 [11] - 合成数据可来自仿真 尤其是通过“自我博弈”产生 例如围棋AI通过上百万次自我对弈学习 每秒完成大量对局 [11][12] - AI能够扫描所有可能路径并进行模拟 生成大量人类终生都无法积累的数据 计算速度比人类快数百万倍 [12] - AI最终会创造比人类更多数据的方式 不必担心数据耗尽 [13] - 未来发展路径可以不只依靠把模型“做大”堆算力 而是让AI系统内部出现更多专业化、分工明确的“小模块/小专家” 这需要更聪明的结构和算法 [11] AI对劳动力市场与经济结构的影响 - AI发展到了中期阶段 职业转变会变得艰难 AI让基础任务效率更高 但KPI和工作量增加 提高薪资变得更加困难 [14][15] - 从长远看 技术从未系统性地造成失业 新的工作机会会在其他行业出现 但这次技术变化发生得非常快 而新的工作岗位需要时间才能出现 [14] - AI和机器人帮助人们让越来越多的东西变得更便宜 甚至免费 [15] - 未来经济可能被技术分成三个“世界”运行 [16] - 第一种是技术“超大规模化”扩张出现的“超级强者”区域 聚集着雄心勃勃、富有创造力、勤奋努力的人 同时拥有大量资本和技术 这些地方会有非常快速的经济增长 成为增长的中心 [16] - 第二种是“慢节奏”经济区域 虽然技术或资本涌入不多 但会享受到基础医疗改善、许多小型项目免费等好处 随着AI和机器人创造越来越多财富 这些增长较慢的地区可能会变得非常宜居 [16] - 第三种是仍然依赖出售廉价劳动力生存的地区 领取极低薪水 而未来无法在价格上击败机器人 这样的地区未来只能依靠极低成本来竞争 [17] - 从中国角度 需要避免依靠廉价劳动力竞争 而是要推动更高端、更复杂的企业模式 拥有超级科技枢纽 [17] 个人在AI时代的竞争力构建 - 生活在当今世界 一定要学会如何使用人工智能 每个人都应该大量使用并努力熟悉其规律 [18] - 传统的大学学位可能不再那么有价值 技术变化太快 现代大学教育的重要性正在下降 [18][19] - 与其“以防万一”去学习 不如采用“及时学习”的方法 即当真正需要解决一个问题时才去学习相关知识 从时间投入产出比来看更有效率 [19][20]
必看,2025年值得关注的AI、物联网、边缘计算七大洞察
36氪· 2025-11-28 19:07
物联网与人工智能融合趋势 - 物联网与人工智能的深度融合正推动工业、制造、能源、物流等行业的智能化浪潮,重塑企业运营模式和竞争格局 [1] - 超过五分之四(84%)的企业认为人工智能是物联网的关键技术,70%的企业表示人工智能加速了其物联网部署 [14] 人工智能技能缺口挑战 - 物联网行业面临巨大的AI技能缺口,尤其在将AI技术整合进产品和服务方面,人才结构与技能谱系失衡明显 [1] - AI技术迭代速度远快于物联网产品生命周期,形成周期错配,传统物联网设备生命周期跨度数年,而AI技术更新速度以季度甚至月为单位 [2] - 依赖外部团队虽可短期补位,但难以构建可持续的内部能力,长期会削弱企业在AI化竞争中的主动权 [2] 关税对供应链与战略的影响 - IDC调研显示60%的企业认为不断上升的关税正在威胁盈利能力与科技预算的稳定性 [3] - 关税导致设备采购延期和供应链中断,迫使企业迁移制造地点、推进供应链多元化 [4] - 关税影响下硬件需求出现下降趋势,企业转向“用更少的硬件做更多的事”,推动数据应用持续强劲增长 [4] 合成数据的应用与驱动因素 - 合成数据是通过统计方法或人工智能技术生成的人工数据,保留原始数据的基本统计特性,可用于补充或取代真实数据集 [6] - 主要应用包括模型训练与算法开发、跨企业协作、系统模拟与场景测试,能在保护知识产权的同时进行多维度分析 [6] - 驱动因素包括数据安全与隐私担忧、跨系统和跨厂商分析需求、AI应用对数据量和多样性的需求 [7] 物联网互联互通趋势 - 客户需求正推动物联网厂商(包括竞争对手)加强互联互通能力,以解决“孤岛式系统”问题,获得更高运营效率和更低集成成本 [8][9] - 云厂商、数据平台公司等第三方提出需访问所有设备数据以提供更强云端或AI能力,促使底层硬件厂商开放接口、共享数据格式 [9] - 业界加速向成熟开放标准靠拢,如OPC UA用于设备间通信,Matter重塑消费级设备互通生态 [9] 工业物联网与混合AI模型 - 工业物联网发展推动混合AI模型,通过在边缘设备与云端之间共享智能,实现速度、成本与性能的平衡 [10] - 边缘AI具备即时本地决策能力,提升响应速度和设备运行时间,云端负责复杂分析、数据聚合和模型训练,二者协同形成混合架构 [11] - 预计未来十年全球约70%的数据将驻留边缘,到2034年边缘AI市场规模将达到1,430亿美元,工业物联网是重要驱动力 [12] 物联网网络安全挑战 - 43%的企业将网络安全视为物联网部署面临的最大挑战,尽管98%的企业预计在两年内能从物联网部署中获得实质性收益 [13] - 物联网部署涉及多地点、多厂商设备,运行于物理安全受限环境,需要比传统IT环境更复杂的安全体系 [13] - 企业正通过实施零信任架构、建立专用网络以及利用AI驱动的威胁检测技术来应对安全挑战 [14] 人工智能对数据处理的颠覆 - 人工智能能将物联网传感器生成的海量数据转化为可操作的商业洞察,快速、高效且几乎无需额外人工干预 [15] - 在制造业中,人工智能可实现预测性维护、优化供应链、支持自动化决策和实时报告生成 [15] - 人工智能加快了分析框架的建立并提供可量化结果,推动过去对数据管理持谨慎态度的企业加速物联网部署 [15]
8位具身智能顶流聊起“非共识”:数据、世界模型、花钱之道
36氪· 2025-11-24 09:00
行业资金需求与投入方向 - 加速进化创始人认为100亿元资金不足以推动具身智能发展,倾向于联合更多合作伙伴共同投入[1] - 智元机器人合伙人计划用100亿元构建全球最大的自我进化、自我闭环的数据飞轮[1][54] - 星海图联合创始人计划用资金构建最大的数据引擎,实现物理世界信息的全面数字化[55] 数据策略与瓶颈解决方案 - 招商局集团AI首席科学家强调真实物理世界数据的重要性,并主张以人自身作为本体采集数据作为成本最低的预训练方案[29][30] - 银河通用创始人认为在真实数据难以采集的场景下,合成数据将发挥重要作用[2][38] - 自变量创始人主张根据具体任务选取合适数据源,采用融合数据策略,互联网数据用于预训练,仿真数据用于导航规划,真实数据用于接触操作[2][46] 世界模型的技术定位 - 银河通用创始人认为世界模型所代表的预测能力是核心,但训练数据必须来自机器人自身,而非人类行为视频[4] - 智源研究院院长认为世界模型对具身智能有作用,但不一定是必须基座,需要基于时空状态进行预测[5] - 加速进化创始人关注世界模型的预测能力,希望模型能基于需求和环境输出未来100帧的动作[18][19] 模型架构发展路径 - 招商局集团AI首席科学家认为具身智能需要完全属于自己的架构,可能转向Vision First或Vision Action First模式,而非延续VLA范式[7] - 星海图联合创始人主张建立平行于大语言模型的基础模型,更可能是Large Action Model,并强调需要闭环模型而非开环的大语言模型[8][10] - 智元机器人合伙人认为最终解决方案将是融合系统,包含VLA、世界模型和强化学习等要素[11] 当前行业挑战与突破点 - 银河通用创始人指出人形机器人数量过少是制约Action First模型发展的关键瓶颈[16] - 智源研究院院长认为统一架构模型需要超大
8位具身智能顶流聊起「非共识」:数据、世界模型、花钱之道
36氪· 2025-11-23 20:56
文章核心观点 - 国内具身智能行业顶尖从业者就技术路径、数据策略等关键问题存在显著非共识,反映出不同的战略重心和第一性原理[4][7][9] - 具身智能的发展面临数据瓶颈,100亿元资金被普遍认为不足以支撑行业突破,需用于吸引人才、构建数据飞轮和基础模型[7][67][68][69][70] - 行业普遍认为具身智能的最终形态将依赖于一个统一的基础模型架构,但当前技术路线尚未收敛,VLA范式受到反思[18][19][23][25][36] 技术路径分歧 - 世界模型被视为具身智能的核心预测能力,但其训练数据必须来自机器人自身,而非人类行为视频[14][15][16] - 有观点认为世界模型是具身智能的关键组成部分,但不一定是必须的基座,其价值在于基于时空状态进行预测[17] - 对当前主流的视觉-语言-动作模型范式提出质疑,认为其语言居中夹层的结构不符合人类操作本质,应探索视觉优先或动作优先的新架构[19][20] - 具身智能模型应是一个闭环系统,能根据世界反馈即时调整动作,这与大语言模型的开环一问一答模式有本质区别[22] - 另一种观点认为终极解决方案将是一个融合系统,包含VLA、世界模型和强化学习等要素,而非单一模型[23][24] - Transformer架构被认为具有跨模态处理的通用性,但需解决输出对齐问题,未来可能出现统一范式[27][28][35] - 长期来看,基于物理世界数据训练的具身多模态模型可能反超并吞并以虚拟世界数据为主的现有模型[40] 数据策略与瓶颈 - 数据稀缺是行业核心瓶颈,解决方案存在分歧:有主张优先采集真实物理世界数据,有强调在难以采集处使用合成数据[9][10] - 数据策略强调真实性、质量和多样性,需在真实场景而非数据厂采集,并最终通过机器人自主交互产生数据[45][46][47][48][49][50] - 视频数据因可海量获取且模拟真实世界而被视为基座模型学习的重要来源,结合真机微调和强化学习提升模型[51] - 仿真数据被强调用于解决复杂控制问题,如足式行走和灵巧手操作,可作为基础控制器启动真实世界数据飞轮[52][53][54][55][56] - 数据使用策略呈现融合趋势,根据不同任务阶段和特性选择互联网数据、仿真数据或真实数据[37][38][59] - 自动驾驶模式被引用为范例,通过C端产品大规模部署实现数据回收,是具身智能数据规模化的可行路径[59][60] 资金分配与战略重心 - 面对100亿元资金,战略重心集中于构建自我进化的数据飞轮、设计专属基础模型以及吸引全球顶尖人才[67][68][69][70] - 资金规模被评价为“不太够”,需联合行业伙伴共同推动,投资于智源研究院等机构以支持长期技术突破[7][67] - 决策的第一性原理包括相信规模定律驱动模型进化、做难而正确的事情、关注落地可行性以及创造长期真实价值[61][62][64][65]
霸王茶姬创始人将与天合光能联席董事长结婚;俞敏洪否认南极邮轮舱位价148万元;何同学称公司今年亏损百万;魅族回应出售总部大楼
搜狐财经· 2025-11-21 15:33
加油站作弊事件 - 市场监管部门突击检查发现加油站通过改造加油机主板和安装作弊软件偷油,偷油比例通常设置在2%到5%,导致消费者加60升油至少少给1.2升 [5] - 加油站通过作弊软件同时偷税,纸质账目报表显示7月报税销售额为77万元,而加密账目真实销售额达850万元,隐瞒近800万元营业额 [5] 公司动态与人事变动 - 霸王茶姬创始人张俊杰将与天合光能联席董事长高海纯结婚,霸王茶姬品牌成立于2017年,门店数量已突破6000家 [4][6] - 百度AI ToC业务调整,副总裁薛苏不再担任文心App负责人,新业务一号位已到岗但因竞业限制身份未公开 [10][11] - 万科举行2025年第一次临时股东会,黄力平接替辛杰出任董事长后首次以新身份公开亮相 [12] - 魅族科技回应出售总部大楼传闻,称“不搬”,魅族科技大楼租期很长会继续使用 [4][7] 汽车行业 - 小米汽车第50万辆整车下线,从第1台到50万台用时1年零7个多月,公司表示将持续抓安全、抓交付并加大科技创新 [9] - 广汽丰田销售副总彭宝林否认“将停产多款主销油车”为不实消息,此前传闻称两款主力燃油车将在2026年停产 [13] - 宝马新款X5上市,售价59.8万-74.8万元,将全系标配智能驾驶辅助系统Pro等功能 [23] - 广汽丰田发布全新换代威兰达,定位“下一代油车”,是丰田首款域控油车并搭载新一代TSS 4.0系统 [23] - 现代汽车美国公司因油箱可能泄漏召回部分2020-2023款索纳塔车型,共计85043辆 [14] 人工智能与科技 - 英伟达CEO黄仁勋表示未看到AI泡沫,指出AI正在改变现有工作负载,Blackwell芯片销售远超预期,云端GPU已全部售罄 [4][15] - 马斯克预测AI进入太空是不可避免的,估计在四五年的时间框架内,进行AI计算的最低成本方式将是使用太阳能AI卫星 [14] - 蚂蚁集团开源万亿参数高性能强化学习权重交换框架Awex,可实现数千卡GPU集群上5-10秒内完成万亿参数级别权重同步 [18] - 微软CEO纳德拉聘请顾问罗尔夫·哈姆斯担任人工智能经济学顾问,以帮助重新思考AI时代的商业模式 [15][16][17] - OverDrive就商标侵权等问题起诉OpenAI,指控其AI文本生成视频应用Sora涉嫌不正当竞争 [15] 资本市场与融资 - 谷歌总市值达到3.65万亿美元,超过微软进入美股总市值前三,其发布的Gemini 3 Pro在评测中备受好评 [4][19][20] - 机器人初创公司Physical Intelligence完成6亿美元融资,估值达56亿美元,致力于开发帮助机器人学习广泛任务的AI软件 [21] - 具身智能机器人公司星动纪元完成近10亿元A+轮融资,由吉利资本领投,2025年商业化订单额突破5亿元 [22] - AI金融科技公司RockFlow完成数千万美元新一轮融资,由蚂蚁集团领投 [22] - AI创业公司数创弧光连续完成种子轮及种子+轮融资,累计融资额数千万元人民币,投后估值数亿元 [22] 其他企业新闻 - 胖东来推出参访退费政策,企业若认为参访无实际收获可在10年内申请全额退费,同时将被永久取消参访资格 [4][8] - UU跑腿为淘宝闪购开设“迎新会”活动,被指抄袭美团营销手法,活动页面设计与话术高度相似 [4][10] - 新东方董事长俞敏洪否认南极邮轮舱位价达148万元,称不同舱位价格在5万到30万元之间,其乘坐的夏古号价格在20万~25万元 [4][6] - 视频博主何同学称公司今年可能亏损一两百万元,主要原因是其发布的一条微博对公司品牌形象产生了较大影响 [4][6] - Meta因在Facebook和Instagram上使用个人数据进行行为定向广告,被西班牙法院裁定支付4.79亿欧元(约合5.52亿美元)罚款 [14]
GEN-0 以及后续的 VLA 发展的看法
具身智能之心· 2025-11-21 08:04
GEN-0模型的技术突破 - GEN-0通过数据工厂采集了270,000小时(约31年)的真实机器人操作数据,目前每周新增10,000小时采集能力[2] - 数据规模相当于每周采集三个当前最大数据集(如OXE或AgiBot-World)的总和[2] - 模型经过半年预训练后展现出比Pi系列更强的性能增益,为后训练提供了更好基础[2] 具身智能领域数据技术演进 - 真实数据采集(UMI)相比仿真数据在长时序任务中具有显著效率优势,成功率接近100%而仿真数据为子任务成功率的乘积[8] - 仿真数据面临sim2real差距挑战,包括视觉差距和物理差距,对布料和软体等物理现象仿真仍不完善[8] - 数据工厂方案在数据多样性方面超越仿真方案,GEN-0通过规模化人力投入实现了数据问题的解决[7] 视觉语言动作模型发展趋势 - 模型参数规模必须增大才能有效利用海量数据,小模型在数据过载时会出现“僵化”现象而大模型持续提升[11] - VLA基础设施(Infra)存在巨大发展空间,需要专门针对时序因果性的研究而非简单套用上游领域方法[11] - 预训练主要学习动作空间的探索能力而非概念泛化能力,模型在VL(视觉语言)能力上的泛化表现有限[12] 预训练科学发现 - 数据质量与多样性比单纯数据量更关键,不同数据混合策略会产生不同模型特性[13] - 低MSE+低reverse-KL模型适合监督后训练,高MSE+低reverse-KL模型更具分布多峰性适合强化学习后训练[13] - 预训练科学将逐渐成熟,国内数据工厂预计会跟进为行业带来预训练环境[14] 合成数据技术的现状与前景 - 仿真平台仍具有价值,特别是在强化学习、提供丰富标注和作为基准测试平台方面[9] - GenManip平台可在14K Objaverse资产上生成数万量级跨具身长时序数据,支持快速构建Manipulation基准[6] - InternData A1合成数据集展现出与Pi Dataset相当的预训练效果,证明合成数据技术的潜力[6]
独家|数创弧光连融两轮估值数亿,解码大模型时代的“数据破壁者”
Z Potentials· 2025-11-20 12:12
公司融资与定位 - 数创弧光(DataArc)于2025年1月成立,孵化自粤港澳大湾区数字经济研究院(IDEA研究院),近期连续完成种子轮及种子+轮融资,累计融资额达数千万元人民币,投后估值数亿元[1] - 两轮融资分别由英诺天使基金与东方富海领投,君科丹木、数字未来、启迪之星等财务投资机构及深智城、头部云厂商等产业资本共同参与[1] - 公司定位于大模型合成数据赛道,通过技术创新精准切入海外小语种等存在结构性数据缺口的蓝海市场[1] 合成数据行业机遇 - 大模型行业正逼近结构性拐点,互联网上高质量、可合法使用的真实数据正被快速消耗殆尽,合成数据从“可选项”变为关键变量[2][3] - 大模型下一阶段能力提升需要大量面向金融、医疗、法律等垂类场景的任务型数据,但真实数据难以采集、标注昂贵且受合规限制,合成数据成为最具可行性的定向强化手段[5] - 在隐私、版权与跨境合规压力上升的背景下,合成数据可在保持分布特征的前提下去隐脱敏,从源头规避法律风险并降低数据成本[5] - 国务院印发的《人工智能+行动的意见》明确提出“支持发展数据标注、数据合成等技术”,合成数据已上升为国家层面战略支撑[6] - 技术需求、市场缺口与政策导向三重力量共同作用,全面打开合成数据的行业时机[7] 数创弧光技术优势 - 公司构建了覆盖大模型训练全生命周期(包括继续预训练、有监督微调、强化学习微调)的数据合成方案,并延伸至合成后的数据筛选、质量评估与应用全链条[7] - 通过“语境图谱”技术把文档、项目、人员和业务知识连接起来生成问答或对话,使合成数据兼具逻辑性并能覆盖更多场景,实验数据显示该方法在多跳问答任务中准确率提高25.4%,同时成本降低85.7%[8] - 合成数据加密训练技术使大模型能够“理解”加密数据,无需解密即可完成训练,兼顾隐私保护与合规要求[10] - 高质量合成数据需要跨过质量、多样性与可靠性三道核心门槛,是一项投入巨大、工程链路复杂的系统工程[7] 产品与市场战略 - 已推出两款核心产品:Living KB专注于企业知识库的动态管理与智能应用,SynData Platform提供一站式合成数据生成服务,特别针对阿拉伯语、东南亚语系等低资源语言设计具备文化适应性的合成框架[10] - 采用二维坐标评估体系指导战略聚焦,横轴衡量数据稀缺性,纵轴衡量业务价值密度,将资源集中于“高数据稀缺性”与“高价值密度”交汇的象限,海外低资源小语种市场正落位于此高价值区间[11] - 国内市场是验证技术方案与打磨产品的重要场景,通过在金融、工业等高复杂度垂直领域落地积累经验,为海外市场拓展奠定基础[12] - 积极布局海外市场,聚焦低资源、小语种区域,尤其是以阿联酋为代表的阿拉伯语地区,当地语料量仅为英文的约1%[12] 商业化进展与护城河 - 国内已在金融等核心ToB场景完成落地,海外正稳步推进在中东等地区的商业化部署,已与头部云厂商、硬件厂商等建立深度绑定,并与数家中东头部客户如国家级政府数字部门、头部典型运营商推进合作[13] - 在小语种场景的技术挑战构成核心壁垒,通过知识增强与语境理解技术,在保持文化适配性的同时有效扩充高质量语料规模,突破方言体系下的数据限制[14] - 基于自研合成数据训练的阿拉伯语TTS与ASR模型已取得显著效果,先获得数据和技术突破的公司会建立起巨大的先发优势和“滚雪球效应”[14][16] - 团队兼具顶尖学术背景与产业实践经验,CEO江旭晖为中科院计算所博士、国家级科研项目核心成员,CTO徐铖晋博士为深圳市特聘专家、原华为“天才少年”[16] 未来发展规划 - 在模态层,公司将从文本延伸至多模态及具身智能,在架构层将从纯云架构向端云结合演进,构建从软件智能到软硬一体的技术路径[18] - 公司已经以文本为技术锚点,陆续完成语音、音频、图像等多模态能力的融合布局[17]