报告行业投资评级 - 投资评级:看好,维持 [6] 报告的核心观点 - 国家数据局于2026年4月15日就《关于推进行业高质量数据集建设行动的实施方案(征求意见稿)》公开征求意见,提出探索词元(Token)交易等新型交易模式,构建以词元为基础的数据集价值体系 [1][3] - 随着《实施方案》落地,我国高质量数据集建设有望加速,数据价值或将进一步被挖掘 [1][9] - 建议关注具备高质量数据资源的厂商,尤其在医疗、金融、工业等细分领域具有稀缺数据的公司 [1][9] 事件描述与政策背景 - 事件描述:2026年4月15日,国家数据局就《关于推进行业高质量数据集建设行动的实施方案(征求意见稿)》公开征求意见 [1][3] - 政策延续:此次《实施方案》是我国在高质量数据集建设领域一系列政策的延续,表明产业发展已从“倡导建设”迈向“按标准建设、按机制试点、按体系推进” [9] - 历史政策脉络: - 2024年1月,国家数据局等十七部门印发《“数据要素×”三年行动计划(2024—2026年)》,提出打造高质量人工智能大模型训练数据集 [9] - 2024年12月,国家发展改革委等六部委联合印发《关于促进数据产业高质量发展的指导意见》,明确提出支持企业开发高质量数据集,发展“数据即服务”等新业态 [9] - 2025年8月,《高质量数据集建设指引》正式发布,提出“1+1”参考路径 [9] - 2026年4月,全国数标委启动高质量数据集等6个方向标准与技术文件验证试点,涵盖建设指南、格式要求、分类指南、质量评测规范等关键内容 [9] 行业发展趋势与意义 - 人工智能技术快速发展,高质量数据集作为训练和优化大模型的基础资源,其质量和多样性直接影响AI大模型的性能和效果 [9] - 《实施方案》明确提出构建“场景牵引数据、数据驱动模型、模型赋能应用、应用创造价值”的“数据飞轮” [9] - 预计“到2028年底,建成一批覆盖重点领域、经过应用验证的行业高质量数据” [9] - 高质量数据集作为人工智能产业化落地的关键生产资料,有望成为连接行业场景、模型训练、智能体应用和数据价值释放的核心枢纽,从而迎来产业发展新阶段 [9] 新型商业模式与价值体系 - 《实施方案》提出,推动商业模式从基础数据包销售向应用程序接口(API)调用、模型化解决方案及全栈服务梯次跃升 [9] - 探索词元(Token)交易等新型数据集交易模式,构建以词元为基础,可量化、可定价的数据集价值体系 [1][3][9] - 词元作为大模型处理信息的“最小信息单元”,其调用量的变化直接反映了大模型的使用情况及应用落地进度 [9] - 以词元为单位的商业模式或逐步成为AI商业化的主流趋势,而词元交易也或将成为未来数据价值变现的重要路径 [9] - 词元经济或将成为智能经济新形态 [9] 投资建议 - 建议关注具备高质量数据资源的厂商 [1][9] - 尤其在医疗、金融、工业等细分领域具有稀缺数据的公司 [1][9]
推进行业高质量数据集建设,探索新型数据集交易模式
长江证券·2026-04-22 14:05