山东将在高端装备等领域开展语料库揭榜挂帅
大众日报·2026-02-06 09:06

项目核心内容 - 山东省工业和信息化厅宣布将在多个重点行业开展“语料库揭榜挂帅”项目申报 [1][2] - 项目旨在通过技术攻关、标准研制、打造高质量语料库及推动应用场景落地,以支持行业大模型的开发、训练和微调 [2] 项目覆盖行业 - 项目聚焦的行业包括高端装备、烟草制品业、农副食品加工业、家具制造业、木材加工、皮革毛皮羽毛及其制品和制鞋业、仪器仪表制造业、废弃资源综合利用业 [2] 项目具体目标与要求 - 项目聚焦于工业制造重点行业的基础理论研究、产品研发设计、生产管理运行、过程质量检测等关键环节和特定场景的知识语料汇聚 [2] - 语料库将基于结构化、非结构化和半结构化数据,经过清洗、去噪和统一格式处理 [2] - 处理后的语料用于支持自然语言处理、计算机视觉、机器学习、深度学习等任务 [2] - 项目验收时,行业相关语料库的数据量要求不低于10万条 [1][2] - 验收的语料库需具有较高的数据质量、领域覆盖程度、潜在价值和应用成效,并需通过第三方测评 [2] 项目鼓励方向 - 山东省鼓励各行业语料库项目加快语料资源的优化整合,并积极开放公共语料 [2]

山东将在高端装备等领域开展语料库揭榜挂帅 - Reportify