广东高质量数据集创新大赛启动,东莞数标园六大平台同步亮相
南方都市报·2025-12-03 17:04

大赛概况与目标 - 全国首个聚焦高质量数据集建设的创新大赛在广东东莞启动,以“真实需求、真实数据、真实方案、真实应用”为原则 [1][2] - 大赛采用“揭榜挂帅”机制和“分期发榜、全年办赛”模式,旨在探索数据价值转化新路径 [2] - 聚焦工业制造、医疗健康、科技创新、城市治理、交通运输等重点领域,目标是建设高质量、可复用的数据集,为人工智能模型训练提供“燃料” [2] - 通过“1套发榜机制+3个竞赛阶段+N场供需对接会”的体系,构建“数据供给—技术研发—场景落地—产业升级”的完整闭环 [3] 首批赛题与参与单位 - 首批高质量数据集赛题来自能源、生物医药、金融、交通、低空、教育等重点领域 [3] - 发榜单位包括中国南方电网有限责任公司、广州(国家)实验室、广东省人民医院、中国平安财产保险公司、佳都科技集团等 [3] 东莞市数据标注产业园 - 东莞市数据标注产业园同步揭牌运营,总投资3.3亿元,位于万江街道 [4][6] - 产业园携手中国电信、百度智能云构建“一园两基地六平台”的产业生态体系 [4] - 东莞计划通过三年努力,形成100个行业级高质量数据集,打造粤港澳大湾区规模最大、智能化程度最高的数据标注基地 [4] - 园区揭牌当天有22家企业签约入驻 [6] 产业生态支撑平台 - 产业园六大赋能平台集中发布,包括数据标注展示中心、多模态数据智能标注平台、数据人才实训认证平台、具身智能数据采标实验室、高质量数据集和大模型测评中心、行业级数据可信空间 [6] - 深圳数据交易所湾区服务创新中心签约落地南城街道,推动数据要素在政务、安全、交易等领域的创新应用 [6] 行业背景与专家观点 - 高质量数据集被视为决定大模型质量的关键因素和数字产业进步的核心基石 [8] - 东莞以“科创制造强市”为底色,规上工业企业数量稳居全国前三,是国家人工智能应用中试基地,兼具丰富的AI应用场景与海量工业数据优势 [4] - 行业专家认为,高质量数据集建设正从单点突破迈向多点开花,为人工智能产业创新提供更坚实数据支撑 [8]