Workflow
GeneCLR DF
icon
搜索文档
Science:AI解锁细菌免疫宇宙“暗物质”,一次性预测239万种抗病毒蛋白
生物世界· 2026-04-04 15:48
研究核心发现 - 2026年4月2日,法国巴斯德研究所的研究团队在《Science》上发表论文,通过开发三个互补的AI模型,大规模预测了细菌的抗病毒免疫系统,揭示了其多样性远超此前认知[3] - 研究预测出**239万个**抗病毒蛋白,其中**85%** 此前被认为与免疫无关,并定义了约**23000个**预测的操纵子家族,大多数此前未知[3][9] - 对超过**32000个**细菌基因组的分析显示,典型细菌基因组中约**1.5%** 的基因专门用于抗病毒防御[9] - 研究不仅进行预测,还通过实验验证了**12个**全新的抗噬菌体防御系统,包含脱氧核糖核酸酶、肽酶等此前与免疫无关的结构域[12] 研究方法与模型 - 研究开发了三种互补的深度学习模型来“透视”细菌基因组[7] - **ALBERT DF模型**:专注于基因组上下文信息,将蛋白质家族视为“单词”,相邻基因序列视为“句子”,学习基因组的“语法规则”[7] - **ESM DF模型**:基于蛋白质语言模型,直接分析氨基酸序列,能捕捉复杂模式,即使与已知系统无同源性也能识别防御功能,实验验证发现包含DUF7946等新结构域[7] - **GeneCLR DF模型**:整合序列和基因组上下文信息的“全能选手”,达到了**99%** 的精确度和**92%** 的召回率,性能最强[7] 行业意义与资源 - 该研究提供了一种大规模发现细菌免疫系统的深度学习框架,并构建了“细菌抗病毒免疫图谱”[14] - 研究团队创建了一个交互式可视化资源(https://defensefinder.mdmlab.fr/wiki/refseq_predicted),包含超过**19000个**候选操纵子家族,为后续实验研究提供线索[14] - 这些新发现的细菌免疫系统可能为开发新型抗菌策略、理解微生物群落动态以及设计合成生物学工具提供全新思路[14]