助力水稻研究与智能育种 种业大语言模型“丰登·水稻”向全球开放网站
海南日报·2025-06-04 09:19
模型发布与定位 - 全球首个专为水稻生物育种打造的大语言模型“丰登·水稻”正式向全球开放网站 [1] - 该模型由崖州湾国家实验室、上海人工智能实验室联合中国农业大学开发,是2024年发布的中国首个种业大模型“丰登”的后续学术成果 [1] - 模型深度融合水稻生物学知识图谱,旨在构建智能决策育种技术体系,提升生物育种研究的效率与质量 [1] 技术基础与数据规模 - 构建了全球最大规模的水稻科研语料库,系统整合了全球超过140万篇中英文文献,覆盖该领域超过98%的公开发表成果 [2] - 以阿里通义千问模型为基础,通过持续训练与精调流程开发而成 [2] - 构建了全球首个水稻多组学知识图谱,整合1879篇关于水稻转录组和蛋白质组的文献数据,图谱包含超过40万个节点与157万条边 [3] 模型性能评估 - 自动化评估使用自建数据集SeedBench(包含1975对问答样本),结果显示丰登模型在准确率等指标上均显著优于通义千问等主流通用模型 [2] - 人工评测数据集HumanDesignRiceQA包含253道专业问题,由326名评审(含83名水稻领域资深专家)参与,结果表明丰登模型答题质量全面超越OpenAI GPT4及人类本科生平均水平 [2] 核心功能与应用前景 - 模型具备强大的语言理解与知识推理能力,展现出在信息检索与知识理解方面的显著优势 [1][3] - 实现了图谱协同推理,能够跨越纯文本表达局限,调用结构化图谱执行精准查询、整合多维证据,有望成为支撑水稻研究与智能育种的关键工具 [3]