Science：使用AI模型预测哪些启动子突变会改变基因表达

研究背景与核心突破 - 人类基因组启动子区域的破坏性突变难以区分有害与良性突变对疾病影响认知有限[3] - 研究开发PromoterAI模型可准确识别扰乱基因表达的非编码启动子突变相关成果发表于Science期刊[3][4] 技术方法与模型训练 - 模型以单核苷酸分辨率训练预测转录起始位点周边的组蛋白修饰/DNA可及性/转录因子结合及基因表达[6] - 基于数千个与跨组织异常基因表达相关的罕见启动子突变构建训练数据集控制顺式与反式混杂变量[6] - 通过异常突变对模型微调实现跨未知基因及数据集的泛化能力[6] 验证与应用效果 - 模型预测效果经基因表达/蛋白质丰度/数量性状位点和报告基因实验多维度验证[7] - 预测显示表达调控作用启动子突变在高等位基因频率区域显著缺失反映自然选择清除作用[7] - 基于UK biobank数万个体数据预测突变效应与蛋白质丰度及数量性状测量值存在强烈关联[7] - 应用于罕见病患者队列发现导致表达不足的启动子突变在孟德尔疾病基因启动子区域特异性富集[7] - 启动子突变占罕见病相关遗传负担的6% 显著提升临床诊断效果[4][9] 行业意义与创新价值 - PromoterAI填补基因组解读领域关键空白核心在于采用已知表达效应遗传突变进行微调的优化过程[9] - 在当前临床基因组分析聚焦编码区背景下将启动子突变纳入解读体系可提升个性化基因组测序诊断效果[9]