我国出台实施方案,行业高质量数据集建设有望加速
长江证券·2026-06-14 21:41

报告投资评级 - 行业投资评级为 看好,并维持该评级 [8] 报告核心观点 - 国家数据局于2026年6月8日发布《关于推进行业高质量数据集建设行动的实施方案》,这是国家层面首次针对AI底座数据集的系统性顶层部署,标志着我国人工智能与数据要素市场建设有望迈入新阶段 [2][6][10] - 全球人工智能竞争正从算法比拼转向数据比拼,高质量数据集是决定人工智能发展水平和产业落地深度的核心要素 [10] - 《方案》的出台有望推动我国高质量数据集建设从局部探索迈向体系化推进,为人工智能在行业的规模化落地提供支持,进而推动数据要素的价值释放 [10] - 随着《方案》深入实施,以产业应用牵引数据供给、以数据驱动产业智能发展的良性循环有望加速形成,数据要素价值有望充分释放并迎来重估,惠及全产业链 [10] 事件与政策内容总结 - 事件描述:2026年6月8日,国家数据局发布《关于推进行业高质量数据集建设行动的实施方案》,对数据赋能人工智能发展作出系统部署 [2][6] - 核心部署方向: - 面向人工智能应用需求,持续推进文本、图像、音视频等多模态高质量数据集建设 [2][6] - 聚焦科学研究、工业制造、低空经济、具身智能等重点领域,加快推进行业高质量数据集建设 [2][6] - 引导具备条件的地区因地制宜开展数据标注创新试验区建设 [2][6] - 专项行动:《方案》围绕行业高质量数据集供给、流通、应用等关键环节,系统部署了强基扩容、标注攻坚、提质增效、应用赋能、管理服务、价值释放六大专项行动 [10] 行业现状与目标总结 - 建设现状:截至2026年第一季度,全国已建成高质量数据集超过 11.6万个,总体量超过 960PB [10] - 调用规模:截至2026年3月,我国日均词元(Token)调用量已超过 140万亿 [10] - 总体目标:《方案》设定了明确的时间节点和阶段性目标,明确“到2028年底,建成一批覆盖重点领域、经过应用验证的行业高质量数据集,打造一批数据驱动人工智能创新发展的典型应用场景,培育一批具备领先优势的创新型数据企业和专业人才,形成一批行业高质量数据集建设工具和标准。” [10] - 发展展望:从目前完成情况看,在《方案》发布后,我国高质量数据集建设有望持续加速 [10] 机制创新与市场影响总结 - 价值释放挑战:当前我国数据要素市场培育不够充分,存在数据产权制度不完善、“三权分置”尚未完全落实、定价难、变现难、付费共识缺失等问题 [10] - 创新交易模式:《方案》提出探索词元(Token)交易模式,以大模型实际消耗的Token作为数据的计量单位,从而构建起以词元为基础的可量化、可定价数据价值体系 [10] - 预期闭环:上述机制有望形成“场景牵引→数据供给→模型训练→业务落地→价值反哺”的数据飞轮闭环,进而推进数据集资产化、商业化 [10] 投资建议总结 - 建议关注具备高质量数据资源的厂商 [2][10] - 尤其关注在医疗、金融、工业等细分领域具有稀缺数据的公司 [2][10] - 同时关注在数据处理、管理和分析方面具备深厚积累的企业 [2][10]

我国出台实施方案,行业高质量数据集建设有望加速 - Reportify