Workflow
Genome Artificial Intelligence
icon
搜索文档
Nature最新封面:谷歌Alpha系列新成员,“秒懂”生命终极蓝图
36氪· 2026-01-29 08:25
核心观点 - Google DeepMind 发布统一DNA序列模型AlphaGenome,该模型能够一次性处理长达100万个碱基对的DNA序列,并以单碱基分辨率预测数千种基因调控相关的分子信号,同时能在一秒内评估遗传变异的影响,标志着基因组人工智能领域的重要里程碑,为生命科学研究开启了全新可能 [1][3][5][6] 技术突破与核心能力 - **处理长序列与高分辨率**:模型突破技术瓶颈,可一次性处理长达1 Mb(100万个碱基对)的超长DNA序列,并在该上下文中实现单碱基级高分辨率预测 [3][6][9] - **统一多模态预测**:模型结合卷积层与Transformer架构,首次将多模态预测、长序列上下文和碱基对分辨率整合于单一框架,能够同时预测包括基因表达、剪接、染色质可及性及三维结构在内的数千种关键分子信号 [6][8][9] - **高效变异效应评估**:模型能在一秒钟内高效评估遗传变异对所有预测分子特性的影响,通过对比突变与参考序列的预测差异进行综合打分,使全基因组范围内大规模筛选致病变异成为可能 [3][12] 性能表现 - **基准测试领先**:在严格的基准测试中,AlphaGenome在24项基因组轨迹预测任务中有22项达到当前最佳水平(SOTA);在26项变异效应预测评估中,有25项达到SOTA性能 [13] - **超越专精模型**:其通用架构在多领域反超了许多专精于单一任务的特化模型,证明了强大的潜力,科学家无需维护多个模型工具箱即可应对多种预测任务 [13][15] 应用前景 - **疾病理解与诊断**:模型能为罕见病(如孟德尔遗传病)的非编码意义未明变异提供强有力的功能证据,辅助诊断;能揭示癌症等复杂疾病中非编码变异通过调控网络致病的机制,例如成功模拟了T细胞急性淋巴细胞白血病中特定突变激活致癌基因TAL1的过程,有助于发现新治疗靶点 [5][18] - **合成生物学与基因治疗**:模型的预测能力可转化为设计能力,指导创造具有特定功能的合成DNA,如组织特异性增强子;在基因治疗领域,可直接用于优化治疗工具,如帮助筛选最安全有效的治疗性反义寡核苷酸候选药物 [19] - **基础研究加速器**:模型能快速生成科学假设,对海量基因序列进行功能预测,帮助科研人员在开展昂贵实验前优先筛选实验对象,大幅提高研究效率;还能预测并验证由生成式模型创造的新DNA序列的功能 [20] 开放性与行业影响 - **向全球科研界开放**:研究人员可通过AlphaGenome API进行非商业研究,并可在GitHub上访问模型代码和权重 [5] - **获得学界高度评价**:被评价为基因组人工智能领域的重要里程碑,其高分辨率预测将技术从理论兴趣转向实际应用,使科学家能够以编程方式研究和模拟复杂疾病的遗传根源;未来有望拓展至植物、动物和微生物等更多物种的DNA解读 [5] 当前局限与未来方向 - **技术挑战**:准确捕捉距离目标基因超过10万个碱基对的极远端调控元件的影响仍是难题;精准复现不同生理、病理或发育状态下细胞特有的细微调控模式仍有提升空间 [21] - **覆盖范围局限**:目前训练和评估主要集中于人类和小鼠,对更多物种的泛化能力有待拓展;预测主要集中在蛋白质编码基因相关模态,对非编码RNA等领域的覆盖尚可丰富 [21] - **未来发展方向**:包括增加输入基因组的多样性(如检测更多物种)、提升变异预测的准确性和实用性(如整合单细胞数据)、整合更广泛的数据模态(如DNA甲基化),以及探索利用DNA语言模型和扩展多物种能力 [22][23]