Workflow
MAPLE
icon
搜索文档
复旦大学校长金力院士最新Nature子刊:利用AI精准预测表观遗传年龄与衰老相关疾病风险
生物世界· 2026-01-21 08:18
文章核心观点 - 复旦大学金力院士团队联合漆远教授团队及无线光年研究人员,在Nature Computational Science上发表研究,开发了一个名为MAPLE的、用于甲基化年龄与疾病风险预测的通用计算框架 [3] - MAPLE采用创新的“成对学习”方法,通过比较两个DNA甲基化样本间的相对关系来预测年龄或疾病风险差异,有效克服了传统表观遗传时钟因技术批次效应导致的性能下降问题,在跨平台、跨组织的数据集上表现出卓越的稳定性和准确性 [4][9][26][27] - 该框架在31项涵盖不同研究、平台、预处理方法和组织类型的基准测试中,以1.6年的中位绝对误差显著优于其他五种竞争方法,并在疾病风险评估方面展现出强大潜力,为衰老评估和早期疾病风险筛查的临床应用提供了更可靠的工具 [4][12][18][28] 传统表观遗传时钟的瓶颈 - DNA甲基化是衰老的关键标志,传统表观遗传时钟基于此开发,但在实际应用中面临核心挑战:技术批次效应 [7] - 当训练数据与测试数据来自不同研究、测序平台或预处理方法时,传统时钟的预测性能会大幅下降,严重阻碍了其在临床中的广泛应用 [7] MAPLE的创新思路:从“绝对值”到“相对关系” - MAPLE采用全新思路,不直接预测绝对年龄,而是学习样本间的相对关系,通过比较两个DNA甲基化样本来推测它们之间的年龄或疾病风险差异 [9] - 该方法巧妙规避了不同数据集间的技术偏差,因为尽管数据来源多样可能导致甲基化谱分布不同,但样本间的实际年龄差异本身是可比较的 [9] - 采用两阶段训练流程:先训练编码器将数据映射到统一潜在空间,再训练预测器估计年龄或疾病状态;成对学习使训练样本量呈二次增长,大幅降低过拟合风险 [9] MAPLE的卓越性能 - 在涵盖31项基准测试的严格验证中,MAPLE表现稳定,中位绝对误差为1.6年,优于其他竞争方法 [4][12] - 在跨平台血液样本测试中,MAPLE平均绝对误差仅为1.45年,相关性系数达0.97;而传统多层感知器模型的误差达4.14年,相关性系数为0.88 [12] - 在非血液组织测试中,MAPLE同样表现优异,平均误差为2.30年,远优于其他方法 [12] - MAPLE在不同数据预处理方法下保持性能稳定,而传统方法在不同预处理数据上误差波动巨大 [12] 疾病风险评估能力 - 除了精准预测年龄,MAPLE在心血管疾病和2型糖尿病等衰老相关疾病的风险评估方面同样展现强大潜力 [18] - MAPLE在疾病识别上的平均曲线下面积达0.97,对疾病前状态检测的平均曲线下面积也达到0.85,显示其精准识别早期风险的能力 [4][19] - 这意味着MAPLE不仅能评估生物学年龄,还能预警潜在健康风险,为早期干预提供宝贵时间窗口 [20] 生物学合理性验证 - 通过分析模型识别的重要CpG位点,发现这些位点富集于器官发育、细胞黏附、认知功能和免疫调节等与衰老密切相关的生物学通路,进一步证实了MAPLE的生物学合理性 [24] 临床应用前景与展望 - MAPLE的优势在于其高精度和卓越的泛化能力,通过成对学习有效削弱批次效应,同时保留与年龄和疾病相关的生物学信号,为甲基化数据在真实临床场景中的应用迈出关键一步 [26][27] - 随着更多验证完成,MAPLE有望在以下方面发挥重要作用:1) 个性化抗衰老干预评估,准确量化生活方式或药物干预对生物学年龄的影响;2) 早期疾病风险筛查,在症状出现前识别高风险个体;3) 衰老生物学机制研究,通过分析重要CpG位点深入理解衰老的分子机制 [28] - 该技术为解决表观遗传时钟领域的核心瓶颈问题提供了新工具,未来“衰老检测”或将成为健康体检的标准项目,助力个性化、精准化的健康衰老管理 [28]