Workflow
衰老评估
icon
搜索文档
复旦大学校长金力院士最新Nature子刊:利用AI精准预测表观遗传年龄与衰老相关疾病风险
生物世界· 2026-01-21 08:18
文章核心观点 - 复旦大学金力院士团队联合漆远教授团队及无线光年研究人员,在Nature Computational Science上发表研究,开发了一个名为MAPLE的、用于甲基化年龄与疾病风险预测的通用计算框架 [3] - MAPLE采用创新的“成对学习”方法,通过比较两个DNA甲基化样本间的相对关系来预测年龄或疾病风险差异,有效克服了传统表观遗传时钟因技术批次效应导致的性能下降问题,在跨平台、跨组织的数据集上表现出卓越的稳定性和准确性 [4][9][26][27] - 该框架在31项涵盖不同研究、平台、预处理方法和组织类型的基准测试中,以1.6年的中位绝对误差显著优于其他五种竞争方法,并在疾病风险评估方面展现出强大潜力,为衰老评估和早期疾病风险筛查的临床应用提供了更可靠的工具 [4][12][18][28] 传统表观遗传时钟的瓶颈 - DNA甲基化是衰老的关键标志,传统表观遗传时钟基于此开发,但在实际应用中面临核心挑战:技术批次效应 [7] - 当训练数据与测试数据来自不同研究、测序平台或预处理方法时,传统时钟的预测性能会大幅下降,严重阻碍了其在临床中的广泛应用 [7] MAPLE的创新思路:从“绝对值”到“相对关系” - MAPLE采用全新思路,不直接预测绝对年龄,而是学习样本间的相对关系,通过比较两个DNA甲基化样本来推测它们之间的年龄或疾病风险差异 [9] - 该方法巧妙规避了不同数据集间的技术偏差,因为尽管数据来源多样可能导致甲基化谱分布不同,但样本间的实际年龄差异本身是可比较的 [9] - 采用两阶段训练流程:先训练编码器将数据映射到统一潜在空间,再训练预测器估计年龄或疾病状态;成对学习使训练样本量呈二次增长,大幅降低过拟合风险 [9] MAPLE的卓越性能 - 在涵盖31项基准测试的严格验证中,MAPLE表现稳定,中位绝对误差为1.6年,优于其他竞争方法 [4][12] - 在跨平台血液样本测试中,MAPLE平均绝对误差仅为1.45年,相关性系数达0.97;而传统多层感知器模型的误差达4.14年,相关性系数为0.88 [12] - 在非血液组织测试中,MAPLE同样表现优异,平均误差为2.30年,远优于其他方法 [12] - MAPLE在不同数据预处理方法下保持性能稳定,而传统方法在不同预处理数据上误差波动巨大 [12] 疾病风险评估能力 - 除了精准预测年龄,MAPLE在心血管疾病和2型糖尿病等衰老相关疾病的风险评估方面同样展现强大潜力 [18] - MAPLE在疾病识别上的平均曲线下面积达0.97,对疾病前状态检测的平均曲线下面积也达到0.85,显示其精准识别早期风险的能力 [4][19] - 这意味着MAPLE不仅能评估生物学年龄,还能预警潜在健康风险,为早期干预提供宝贵时间窗口 [20] 生物学合理性验证 - 通过分析模型识别的重要CpG位点,发现这些位点富集于器官发育、细胞黏附、认知功能和免疫调节等与衰老密切相关的生物学通路,进一步证实了MAPLE的生物学合理性 [24] 临床应用前景与展望 - MAPLE的优势在于其高精度和卓越的泛化能力,通过成对学习有效削弱批次效应,同时保留与年龄和疾病相关的生物学信号,为甲基化数据在真实临床场景中的应用迈出关键一步 [26][27] - 随着更多验证完成,MAPLE有望在以下方面发挥重要作用:1) 个性化抗衰老干预评估,准确量化生活方式或药物干预对生物学年龄的影响;2) 早期疾病风险筛查,在症状出现前识别高风险个体;3) 衰老生物学机制研究,通过分析重要CpG位点深入理解衰老的分子机制 [28] - 该技术为解决表观遗传时钟领域的核心瓶颈问题提供了新工具,未来“衰老检测”或将成为健康体检的标准项目,助力个性化、精准化的健康衰老管理 [28]
清华大学开发AI大模型,准确预测人类衰老,登上医学顶刊Nature Medicine
生物世界· 2025-07-27 10:49
衰老评估新方法 - 清华大学万科公共卫生与健康学院底骞副教授团队开发基于大语言模型(LLM)的生物学年龄预测方法,仅需体检报告即可评估整体及器官特异性衰老程度 [3][4] - 该方法突破传统衰老指标局限,实现精确、可靠且经济高效的大规模人群衰老评估 [5][23] 技术框架与原理 - 将血压、肝功能等体检数据转化为文字报告输入LLM(如Llama3),模型通过预训练医学知识库智能推演衰老程度 [10][12] - 输出结果包括全身衰老程度(整体生物学年龄)及心脏、肝脏等六大器官专属年龄 [11] 验证数据与性能 - 研究覆盖全球六大数据库(英国生物样本库等),验证样本超1000万人 [15] - 全因死亡风险预测准确率75.7%,较端粒长度等方法高15%;冠心病风险预测准确率70.9%,较其他机器学习模型高8% [15] - 肝硬化风险预测准确率81.2%,较临床指标方法高22% [15] - LLM预测年龄差每增加1岁,全因死亡风险上升5.5%,冠心病风险增加7.2% [16] 临床应用价值 - 心血管年龄差增大使冠心病风险增加45%,肝脏年龄差增大使肝硬化风险增加63% [19] - 发现322个与衰老加速相关的关键蛋白(56.7%为新靶点),其中55%与死亡率显著相关 [19] - 连续3年体检数据输入可生成个人衰老速率曲线,疾病预警准确率较单次体检提升3倍 [19] 研究扩展与潜力 - 利用年龄差识别加速衰老相关蛋白标志物,开发270种疾病风险预测模型 [20] - 框架支持动态衰老评估及个性化健康管理 [20][23]