Science:使用AI模型预测哪些启动子突变会改变基因表达
撰文丨王聪 编辑丨王多鱼 排版丨水成文 在人类基因组中,基因的转录始于 启动子 (Promoter) ,这一核心序列元件整合来自基因组近端和远端 区域的信息,以精确调控基因表达。启动子中的破坏性突变会导致基因表达发生重大改变,但由于难以区 分有害突变和良性突变,其对人类健康和疾病的影响,我们目前仍知之甚少。 在大规模功能基因组学数据集上训练的 人工智能 (AI) 模型有可能学习转录和表观遗传程序背后的调 控"语法"。将遗传突变与功能后果相联系的适当训练数据集对于实现准确的突变效应预测至关重要。 实际上,目前仅有少数罕见遗传病患者通过外显子测序得到确诊,这表明其他未被识别的致病突变可能存 在于非编码序列 (包括启动子) 中。 PromoterAI 是一种通过评估启动子区域基因组序列来预测启动子突变对基因表达影响的深度神经网络。研 究团队首先以单核苷酸分辨率训练该模型,使其能够预测转录起始位点周围的组蛋白修饰、DNA 可及性、 转录因子结合和链特异性基因表达。随后,研究团队基于携带配对基因组与 RNA 测序数据的群体样本,构 建了包含数千个与跨组织异常基因表达相关的罕见启动子突变的训练数据集,同时控制了顺式 ( ...