山东将奖补垂直领域行业大模型和语料库
大众日报·2025-09-15 09:04
语料库,简单来说,就是大模型用于学习训练的"百科全书"。它由海量的文本、代码、图像等数据 构成,通过这样的"百科全书",大模型能越来越"聪明"。青岛国实科技集团有限公司高级总裁谭华介 绍,他们研发的大模型"海悟",就是以4000多万高质量的海洋文档、专利及论文等专业语料为基石,训 练出卓越的海洋领域自然语言理解、深度逻辑推理与专业内容生成能力。但在目前,高质量的语料库相 对缺乏,山东为了训练培育出更多聪明的"大脑",将用两到三年时间,每年遴选支持不超过20个项目, 围绕重点行业建设起一批语料库。 第三批政策清单提到的语料库遴选,将采取"揭榜挂帅"的方式进行。揭榜成功后,每个项目给予最 高75万元奖补;对支持项目验收评价结果为"优秀"的,每个项目再给予最高75万元奖补,即每个项目最 高能获得150万元奖补。同时,若支持项目验收评价结果为"不合格",将被收回全部奖补资金。 "如果把人工智能产业比作一辆汽车,那么算法相当于整车设计与控制系统,算力相当于发动机, 数据语料相当于燃料。"省人工智能协会秘书长苏冠群介绍,今年以来,山东已经在算力、语料、大模 型等重要领域分别出台了财政奖补措施,为企业创新突破提供引导支持。 ...