AI化学家来了:华人学者一作Nature论文:AI生成化学合成实验方案,加速药物设计
生物世界·2026-01-20 16:00

文章核心观点 - 耶鲁大学研究团队在《自然》期刊上发表论文,开发了一个名为MOSAIC的新型AI系统,该系统能够生成带有置信度指标、可重复且可直接执行的复杂化学合成实验方案,在实验验证中取得了71%的整体成功率,合成了超过35种新化合物,甚至发现了训练数据中未出现过的新化学反应方法[3] - MOSAIC框架基于“集体智能”理念,通过训练2498个专项化学“专家”模型,将化学反应空间划分为多个专业区域进行处理,其性能超越了参数规模大数个数量级的通用大语言模型(如ChatGPT-4o mini、Claude 3.5系列)[9][12] - 该系统旨在增强而非取代人类化学家,通过快速审视广阔的化学空间并识别有潜力的实验方向,将确定合适条件的繁琐过程缩短至几分钟,从而加速新药研发、功能材料设计等多个领域的进程[14][16] 化学研究面临的挑战 - 科学文献正呈指数级增长,每年有数十万个新的化学反应被报道,但将这些知识转化为实验室中的可行方案,仍严重依赖专家的个人经验与耗时的手动检索,传统方法效率低下且难以规模化[2][6] MOSAIC系统的工作原理 - MOSAIC(Multiple Optimized Specialists for AI-assisted Chemical Prediction)是一个新型计算框架,能让化学家利用数百万个反应方案的集体知识[6] - 其核心是“集体智能”,研究团队基于Llama-3.1-8B-instruct架构,在Voronoi聚类空间中训练了2498个专项化学“专家”模型[9] - 该系统将化学反应空间划分为多个专业区域,每个区域由专门的AI专家处理,类似于综合性医院的分诊系统,能够持续扩展其覆盖范围与精度,并直接从数据中发现和利用转化模式间的相似性[9][10] MOSAIC系统的实验性能 - 在实验验证中,MOSAIC系统取得了71%的整体成功率,实现了超过35种新化合物的合成[3] - 在产率预测分析中,MOSAIC的预测区间中值与真实产率中位数呈现了显著相关性(R²=0.811),表明它能有效捕捉不同反应类型的产率模式,而非简单记忆常见反应[12] - 在试剂和溶剂预测方面,当聚合最多三位专家的预测结果时,试剂的完全匹配率大幅提升至43.0%,在多位专家预测模式下,至少能部分预测出正确试剂或溶剂的成功率高达94.8%[12] - 仅拥有80亿参数的MOSAIC,其性能超越了参数规模大数个数量级的通用大语言模型[12] MOSAIC系统的应用与影响 - MOSAIC能够实现大量化合物的合成,应用范围包括药物、催化剂、先进材料、农用化学品甚至化妆品[4] - 该系统被比作现代化学合成的“指南针”,其价值在于能够快速审视广阔的化学空间,识别出那些原本需要大量文献调研和积累经验才能发现的有潜力的实验方向,将确定合适条件的繁琐过程缩短至几分钟内[14] - 随着MOSAIC等AI系统的不断完善,化学研究范式正在发生深刻变革,AI辅助的化学合成将成为常态,大大加速新药研发、功能材料设计等领域的进程[16] - AI与人类化学家的协同合作,将推动化学科学向更深更广的领域拓展,为人类解决能源、医疗、环境等重大挑战提供全新可能[17]