登上Nature封面:谷歌DeepMind推出DNA模型AlphaGenome,全面理解人类基因组,精准预测基因突变效应
生物世界·2026-01-29 12:28

文章核心观点 - DeepMind推出新型AI工具AlphaGenome,这是一个能够处理长达100万碱基对序列的统一DNA序列模型,可高精度预测广泛的基因组特征和突变效应,标志着基因组AI模型从“单项专家”向“通用翻译官”的重要转变 [2][26] - AlphaGenome在技术上有三大突破:兼顾长序列分析与单碱基分辨率、统一处理多任务、高效评估突变影响,其性能在绝大多数任务中超越了现有的专用模型 [10][11][12][13][19] - 该工具在解析非编码区域、探究疾病机制、研究罕见遗传病及指导合成生物学设计等方面展现出强大的实际应用价值,有望推动对基因组的基本理解和新疗法的开发 [2][3][22][24][26] 基因组解读的挑战与背景 - 人类基因组中约98%为非编码序列,其功能至今仍是生物学最大的谜团之一,解读DNA序列的细微变化如何影响生物体是巨大挑战 [7] - 过去十年开发的许多AI模型仅专注于单一任务,科学界越来越需要能够“All in One”解读DNA序列的工具 [8] AlphaGenome的技术突破 - 兼顾“远景”与“近景”:通过创新算法架构,首次实现在100万个碱基对长度上保持单碱基分辨率的分析能力 [11] - 多任务统一处理:可同时预测数千种分子特性,如基因起止位置、RNA剪接位点、DNA可及性、蛋白质结合位点等,一个模型即可全面解析 [12] - 高效的突变影响评估:能在一秒钟内评估基因突变对所有分子特性的影响,快速识别可能导致疾病的遗传变异 [13] 模型架构与技术核心 - 架构巧妙结合了卷积神经网络与Transformer模块,前者识别DNA序列中的局部模式,后者建立长距离联系以理解全局语境,实现了“既见树木,又见森林” [15][16] 性能表现 - 在24项DNA序列功能预测任务中,AlphaGenome在22项中实现了最先进性能(SOTA) [19] - 在26项遗传变异影响预测任务中,AlphaGenome在24项中实现了最先进性能(SOTA) [19] - 作为一个“通用模型”,其表现超越了多数为特定任务优化的“专用模型”,打破了传统认知 [19] 实际应用与价值 - 疾病机制解析:成功用于探究T细胞急性淋巴细胞白血病(T-ALL)中非编码突变通过引入MYB DNA结合基序激活致癌基因TAL1的潜在机制 [22] - 罕见遗传病研究:能够直接从DNA序列预测RNA剪接位点,为理解由剪接错误引起的疾病(如脊髓性肌萎缩症)提供新工具 [24] - 合成生物学设计:其预测能力可用于指导设计具有特定调控功能的合成DNA序列,例如组织特异性基因开关,为精准基因治疗奠定基础 [24] 行业意义与未来展望 - 结合AlphaFold和AlphaMissense等成果,科学界正在构建一个前所未有的“基因组集成开发环境”,代表生物学研究从描述性科学转向预测性科学的根本转变 [26] - AlphaGenome是理解和编辑生命代码的强大解码器,为分析调控基因组提供了强大且统一的模型,提升了从DNA序列预测分子功能和突变效应的能力 [26]