Workflow
获得诺奖后,DeepMind推出DNA模型——AlphaGenome,全面理解人类基因组,尤其是非编码基因
生物世界·2025-06-26 16:06

核心观点 - DeepMind推出新型AI工具AlphaGenome,能够全面准确地预测人类DNA序列中的单碱基突变对基因调控的影响,处理长达100万碱基对的DNA序列并输出高分辨率预测结果[2] - AlphaGenome在多项基准测试中达到顶尖水平,在24项评估中有22项优于最佳外部模型,26项评估中有24项与最佳模型持平或更优[18] - 该模型特别适合研究罕见突变和疾病机制,例如预测白血病患者中的非编码基因突变如何激活附近致癌基因[27] AlphaGenome技术特点 - 长序列高分辨率:能分析100万碱基对的DNA序列,单碱基精度预测,训练时间仅需4小时且计算资源仅为Enformer模型的一半[12] - 多模态预测:可同时预测基因起始/终止位置、RNA水平、DNA可及性等数千种分子特性[9][13] - 高效突变评分:1秒内评估基因突变对所有特性的影响[14] - 新型剪接建模:首次直接从序列明确建模RNA剪接位点,有助于理解遗传疾病机制[15] 行业应用价值 - 疾病研究:更精确确定疾病成因和突变功能影响,发现新治疗靶点,特别适合研究罕见遗传病[23] - 合成生物学:指导设计具有特定调节功能的合成DNA[24] - 基础研究:加速基因组功能元件绘制和关键DNA指令识别[25] - 案例验证:成功预测T细胞白血病中非编码突变通过引入MYB结合基序激活致癌基因TAL1[26][27] 技术局限性 - 难以准确捕捉相隔超过10万碱基对的调控元件影响[32] - 未针对个人基因组预测进行验证,无法全面展现突变导致复杂性状的机制[32] - 目前仅开放非商业用途API接口,预测功能仅限于科研用途[32] 模型架构与性能 - 架构结合卷积层检测短模式、Transformer传递序列位置信息、多层网络转化预测[9] - 训练数据来自ENCODE、GTEx等公共联盟的数百种人类和小鼠细胞数据[9] - 在剪接分类(auPRC)、RNA-seq覆盖(Pearson r 32bp)、DNA可及性等模态评估中相对改进最高达32.6%[29]