天然产物挖掘
搜索文档
Nature子刊:刘振明/郑南宁等开发AI新模型,用于天然产物挖掘及相关药物发现
生物世界· 2026-05-08 12:11
研究背景与行业痛点 - 天然产物源自微生物、动物或植物的代谢产物,具有多样化的生物活性,对药物发现至关重要 [2] - 当前天然产物研究中的深度学习方法主要依赖针对特定下游任务设计的监督学习策略,这种“一任务一模型”的模式泛化能力不足且性能有较大提升空间 [2] - 现有的分子表征方法并不完全适用于天然产物特有的任务需求 [2] 核心研究成果 - 北京大学药学院与西安交通大学人工智能与机器人研究所的研究团队在《Nature Machine Intelligence》上发表了题为“Pretraining a foundation model for small-molecule natural products”的研究论文 [2] - 该研究开发了一个用于天然产物挖掘及相关药物发现的基础模型——NaFM [3] - NaFM采用专门针对天然产物设计的预训练策略,结合对比学习与掩码图学习目标,在捕捉侧链信息的同时突出分子支架中的进化信息 [4] - NaFM在与天然产物挖掘及药物发现相关的多项下游任务中取得了最佳性能 [4] 模型验证与应用展示 - 研究团队通过将分类学分类任务与专注于合成分子的基线模型比较,说明了现有模型在理解天然合成过程方面的不足 [4] - 通过在基因和微生物层面进行细粒度分析,NaFM展现出捕捉进化信息的能力 [4] - 研究团队将该方法应用于虚拟筛选,展示了其能够形成信息丰富的天然产物表征,从而更有效地识别潜在药物候选分子 [4] 行业评价与意义 - 《Nature Machine Intelligence》期刊为此发表了题为“Learning the chemical language of natural products”的News & Views文章,指出该研究开发出了一种有前景的基础模型,可用于天然产物挖掘的一系列下游应用 [5]