AGI4S(AGI for Science)
搜索文档
Cell子刊:西湖大学李子青团队等提出AI虚拟细胞代谢研究新范式
生物世界· 2026-03-30 08:00
文章核心观点 - 西湖大学李子青团队联合多家机构在《Trends in Biochemical Sciences》上首次正式提出并定义了“AI虚拟代谢”新概念,确立了以“AI+多组学”驱动代谢网络重构的AGI4S研究新范式,为虚拟代谢研究指明了全新方向[2] 人工智能虚拟代谢的概念与框架 - 文章提出了“人工智能虚拟代谢”新概念框架,旨在通过将化学逆合成规划与生物学约束相结合,实现智能代谢途径重建,以促进生物学理解和代谢工程[3][7] - AIVM框架将利用在多层组学数据上训练的大语言模型,生成细胞功能的分层表征,并纳入酶水平约束、热力学过滤及代谢组学背景等多种生物学约束,以提高预测的生物学真实性和可信度[8] - 该框架通过基于图的迭代设计构建多步骤生物合成途径,其逻辑基于化学逆合成,但根植于酶驱动、上下文感知的细胞代谢[9] 技术方法与创新 - 传统代谢重建方法常因实验数据有限、途径高度分支及依赖于上下文的调控而难以完全重建复杂网络,即使对于相对简单的葡萄糖代谢网络也需全面了解所有代谢酶、反应物及相互关系[5] - 现有AI方法将途径预测视为使用预定义反应模板的分类任务,推广能力有限且模型通常是静态的,而AIVM框架旨在统一逆合成推理与生物学约束,并整合多组学数据、热力学可行性检查及基因组规模代谢模型连接性[6][21] - 框架将大语言模型定位为代谢“协同科学家”,负责非线性推理以发现未知途径、为反应提出酶变体并跨生物体调整设计,推动该领域从基于规则的预测转向任务无关的、发现驱动的探索[21] 应用场景与系统建模 - 以在酿酒酵母中重建青蒿酸途径的假设场景为例,阐明了AIVM工作流程:通过逆合成推理提出生物合成路线,由多组学训练的LLM优先考虑酶变体并提出工程干预措施,再经热力学过滤和通量平衡分析评估,最终由LLM分析调控相互作用以提供更高层次的设计见解[11] - 在系统水平上,基因组规模代谢模型是应对代谢网络复杂互连性的关键工具,例如大肠杆菌模型iML1515已被广泛用于模拟生长和预测基因敲除策略[12] - 通量平衡分析是模拟稳态通量分布的基础,而AI驱动的预测与系统水平建模的迭代集成对于构建稳健的模块化代谢电路至关重要[15] - 超越通量平衡分析,经过多组学特征和基因组规模代谢模型拓扑结构训练的代谢大型语言模型可作为自主代理,捕捉非线性依赖关系并提出新途径、基因扰动建议等,实现动态的、知识驱动的工程[16] 评估与未来挑战 - 评估AI生成的代谢网络需采用多层策略,在反应水平验证原子质量平衡、吉布斯自由能变及酶学支持,在网络水平确保其能无缝集成到基因组规模代谢模型中并保持连接性,最终通过通量平衡分析和组学数据交叉验证功能相关性[18] - 关键挑战包括需要大规模高质量数据集来增强模型真实性、扩展到基因组水平网络需要标准化基准和资源库、以及真核生物区室化等增加的复杂性,湿实验室验证对于建立生物学可信度仍然不可或缺[22] - 文章提出了一条通往虚拟代谢途径重建的路线图,认为AI工具已能加速优化,使AI赋能的虚拟细胞愿景正在成为现实,但完全取代湿实验室的试错法仍很遥远[22]