TranSiGen
搜索文档
Nature子刊:浙江大学杨波/谢昌谕/曹戟团队开发AI模型XPert,精准预测细胞对药物的反应
生物世界· 2026-01-27 16:00
文章核心观点 - 浙江大学研究团队开发了一个名为XPert的双分支Transformer模型,该模型能够准确预测药物诱导的细胞转录组扰动反应,在患者特异性反应预测准确率上实现了高达15.04%的提升,并提供了机制上的可解释性,代表了计算机辅助药物发现和精准医学领域的重大进步 [2][19][20] 传统药物研发的困境 - 传统“一种药物-一个靶点”的研发模式存在局限,因为药物通常与多个分子靶点和通路相互作用,触发复杂的信号级联反应 [4] - 理解全基因组范围内的扰动效应对阐明药物机制至关重要,但高质量临床扰动数据的稀缺及数据中的混杂因素限制了该领域进展 [4] - 早期基于自编码器的深度学习方法虽能消除混杂因素,但存在过度去噪风险,可能掩盖关键生物信息 [4] XPert模型的创新设计 - XPert模型采用双分支Transformer架构,分别编码扰动前和扰动后的细胞状态,从而能区分内在转录模式与扰动触发的调控变化 [6][7] - 模型将每个细胞表示为基因标记的“句子”,并整合了四个关键扰动属性:药物的化学特性、生物特性、扰动时间和剂量 [8] - 模型通过知识引导的异质图弥合化学和生物空间的差距,该图基于两种生物学直觉推断潜在的药物-基因相互作用:蛋白-蛋白相互作用网络中相近的基因反应相似;结构相似的药物通常靶向相似的蛋白质 [8] 卓越的性能表现 - 在基准测试中,XPert一致优于所有基线模型,在最具挑战性的冷细胞设置中表现突出 [10] - 在单剂量-单时间点预测任务中,XPert的皮尔逊相关系数比次优模型TranSiGen高出36.7%,均方误差降低78.2% [11] - 面对训练中未见过的细胞系,XPert比当前最先进模型的平均性能提高了67.54%,展示了强大的泛化能力 [11] - 研究团队发现,基于VAE的方法存在过度校正的局限性,而XPert基于注意力的框架有效避免了这一问题 [12] 精准的多剂量-多时间预测 - XPert支持多剂量-多时间预测,能够精确解析药效轨迹并揭示药物效应背后的关键分子事件 [13] - 以药物伏立诺他为例,PCA分析显示其剂量反应梯度与剂量增加强烈相关,证实了模型预测的准确性 [14] - 模型能准确捕捉剂量变化对基因表达的逆转效应,例如增加伏立诺他剂量会使NRIP1和ELOVL6等基因从上调变为下调 [14] - 尽管临床前和临床数据存在领域转移,但预训练增强了对未见患者的预测,在泛癌种、乳腺癌和白血病中分别实现了2.51%、15.04%和12.58%的性能提升 [15] 揭示临床反应与耐药机制 - 分析显示,对药物来曲唑有响应的患者比非响应者表现出更强的转录组反应 [17] - 通过基于注意力的分析,XPert独特地识别了其他关键耐药生物标志物,如TIAM1、RPCP*1、HK1和CDKN1B,这些在传统表达水平分析中难以发现,为耐药机制提供了新见解 [17] 展望未来 - XPert代表了通过可解释且可泛化的深度学习框架模拟药物诱导扰动效应的重大进步 [19] - 随着进一步发展,该模型有望成为下一代计算机辅助药物发现流程和精准医学平台的核心组件 [19] - 这项研究为个性化医疗开辟了新途径,向“在计算机上模拟药物效果”的目标迈出了坚实一步 [20]