文章核心观点 - 北京经济技术开发区通过“数据20条”政策及最高200万元的现金奖励,首次集中兑现并表彰了20家企业的38个高质量数据集,旨在激活数据要素价值,筑牢人工智能发展的数据根基,推动数据产业高质量发展[1] - 获奖数据集在具身智能、生物医药、工业制造、智能网联等多个重点产业领域实现了填补国内或全球数据空白的突破性进展[2] - 政策奖励资金被企业明确用于加码研发投入与生态共建,直接转化为产业发展动能,助推产业升级[3] - 北京亦庄已获批国家数据产业集聚区试点,正打造“亦城数港”产业集聚标杆,并计划在2026年投入总规模超过2亿元的资金,持续深化数据产业全链条支持[6] 政策背景与奖励机制 - 2025年,北京亦庄发布“数据20条”政策,明确支持高质量数据集建设,近日首次集中兑现[2] - 政策以场景为驱动,旨在畅通数据供给,激励企业破解数据瓶颈,助力全域人工智能之城建设[2] - 奖励最高额度为200万元人民币[1] - 2026年,北京亦庄将聚焦数据产业全链条关键环节,集中落地系列政策兑现举措,总资金规模超过2亿元[6] 具身智能领域数据集突破 - 北京人形机器人创新中心有限公司的“RoboMIND2.0数据集”填补了国内双足人形机器人开源数据空白,已支撑国内首个通过国标测试的跨本体具身VLA大模型的训练和开源[2] - 星海图打造了全球首个开放场景真机数据集,开源后双平台跃居全球机器人真机数据集下载量首位[2] - 行业现有数据仍不能满足人形机器人模型训练需求,企业计划利用奖励资金进一步扩大真实场景数据规模,推动机器人实际落地应用[4] 生物医药领域数据集突破 - 麦克奥迪医疗采用“三甲医院病理专家诊断意见+AI制片质控+临床信息关联脱敏数据”模式打造数字病理疑难病例数据集,相关数据已获得北京数据交易所《数字资产登记凭证》[3] - 药云构建了国内首个面向真实世界证据生成的垂直化、结构化、可监管医药融合数据集,已为生物医药企业提供服务[3] - 企业计划利用专项资金持续加大研发投入,推进数据开放上架与AI应用大模型的开发,该数据集有望成为区域医药健康与医疗AI产业的重要基础资源[4] 工业制造领域数据集突破 - 北京蚂蚁工场构建了国内首个覆盖“非标+标准件”全流程柔性制造的强合规数据集,填补了“数据驱动智能制造闭环+大模型可持续训练”双重空白[3] - 星龙数智首创钢铁行业全产业链高质量数据集建设与应用平台,助力钢铁企业生产协同效率提升超10%、能源消耗降低3%以上[3] - 企业计划将“数据集成果”升级成“数据能力供给”,做成通用接口,并探索受控开放、场景共建和联合验证,推动数据在产业链中流动[4] 智能网联领域数据集突破 - 四维图新智驾的“基于4D时空障碍物检测的高质量自动驾驶数据集”首创“4D时空+自动化闭环”模式,填补了中国特有的复杂交通场景数据空白[3] - 恺望数据集助力自动驾驶向无图模式加速转型[3] - 四维图新的数据集已赋能头部智驾企业,助力其大幅缩短研发周期、降低标注与挖掘成本,公司2024-2025年智驾新增定点约680万套,合作覆盖20余家主流车企[5] 企业资金用途与产业影响 - 获奖企业普遍将奖励资金直接投入研发升级与生态共建,视其为产业发展的催化剂[3] - 资金将用于弥补关键短板、深化技术迭代、加快与区域重点企业对接,以及提升数据集行业影响力[4][5] - 高质量数据集正成为数字经济时代的核心生产要素,通过填补数据空白、优化产业流程、推动技术创新与模式迭代,为全域人工智能之城建设注入数据动能[6] 区域产业发展规划与展望 - 北京经济技术开发区已获批国家数据产业集聚区试点,正打造“亦城数港”产业集聚标杆[6] - 未来将持续深度推进“数据二十条”,2026年的超2亿元资金将涵盖数据流通基础设施建设运营、核心技术攻关、高质量数据集认定、智慧城市场景开放、数据要素流通券发放及市场示范奖励等核心领域[6] - 企业期待更多同行参与高质量数据集建设,形成可复制、可推广的应用成果,并希望政策持续赋能,筑牢合规流通保障与优质营商环境[6]
多领域数据集填补空白 北京亦庄最高兑现200万元奖励