蛋白大语言模型
搜索文档
基于自主生物制造数据的生物制造高产菌株改造示范场景
新浪财经· 2026-01-13 19:33
场景概述 - 为解决生物制造领域数据分散、格式不一、高质量数据供给不足及AI应用缺乏标准化数据支撑等问题,中国正在建设生物制造科学数据共享服务平台 [1][6] - 该场景以“标准引领、数据整合、智能驱动、产业转化”为主线,构建覆盖生物资源供给、生物元件预测与生成、工业酶设计、菌种改造全链条的数据服务体系 [1][6] - 旨在推动生物制造从传统实验驱动向智能数据驱动转型,为合成生物制造产业发展提供高质量数据要素支撑 [1][6] 总体思路与平台建设 - 归集整合多源异构生物数据,整合了国家菌种资源库、省级微生物保藏机构、国际公共数据库等,形成涵盖菌种、基因组、酶、代谢途径、文献、专利等在内的生物制造基础数据资源池 [3][8] - 构建了78个可直接用于人工智能训练的高质量、标准化数据集,覆盖工业菌种基因组、功能启动子、终止子、调控因子及多类工业酶等关键要素 [3][8] - 建设“平台+数据+模型”一体化支撑体系,打造生物制造科研基础平台实现数据一站式检索与共享,并研发基于蛋白大语言模型的AI工具以支持生物元件的智能挖掘与定向设计 [3][8] 创新举措 - 牵头制定国际ISO标准,规范合成生物元件的描述框架,提升了中国在国际生物制造领域的话语权 [4][9] - 构建了生物制造新型科研信息化基础平台,整合实物、数据及科研仪器资源,为产业发展筑牢数据根基 [4][9] - 研发了蛋白大语言模型驱动的人工智能发现范式,突破传统序列比对局限,实现新型全局调控因子与功能元件的高效挖掘,形成可迁移、通用化的智能设计新路径 [4][9] 主要成效 - 社会效益方面,GR-Discriminator等AI模型的研发与应用实现了智能化技术创新范式突破,生物制造基础数据资源平台正式运行,产业基础支撑能力全面夯实,通过ISO标准制定提升了国际话语权与规则制定权 [5][10] - 经济效益方面,基于大数据挖掘和人工智能设计,首创了普瑞巴林手性中间体R-单酰胺一步酶法合成技术,已转化落地国内多家企业 [5][10] - 该新工艺避免了有毒有机溶剂的使用,合成成本比传统化学拆分工艺下降50%,预计产值超亿元,为生物制造产业的可持续发展注入强劲动力 [5][10]