文章核心观点 - 密歇根州立大学、密歇根大学等机构的研究团队在Cell期刊发表论文,开发了一个名为GPS的基于深度学习的药物发现与设计平台 [3] - GPS平台的核心突破在于仅凭化合物的化学结构,就能预测其对人体细胞基因表达的影响,并以逆转疾病相关转录组特征为指导,进行大规模化合物筛选和先导分子优化 [9][10] - 该研究在肝细胞癌和特发性肺纤维化两类难治性疾病中验证了GPS平台的有效性,发现了具有潜力的新化合物系列,并提出了“结构-基因-活性关系”新概念,为AI驱动的从头药物发现开创了新范式 [4][14] 当前虚拟药物筛选研究的困境 - 当前研究主要基于针对特定蛋白质靶点的对接或基于有限筛选数据训练的AI模型,很少利用单细胞RNA测序等转录组学技术进步带来的丰富疾病特征 [2] - 基于逆转疾病转录组特征的“老药新用”策略受限于已知化合物数据库,无法支持新型化合物的筛选与优化,限制了其在早期药物发现中的应用 [2] - 肝细胞癌是全球第六大常见癌症、第三大癌症死亡原因,每年夺走数十万人生命,现有疗法面临耐药性和毒副作用等问题 [7] - 特发性肺纤维化确诊后患者中位生存期仅约3年,目前尚无根治方案 [7] - 传统药物研发模式通常耗时10-15年,耗资数十亿美元,成功率却不足10% [7] GPS平台的原理与工作流程 - 平台首先利用LINCS数据库中海量的药物-基因表达数据训练深度学习模型,并通过稳健协同学习框架提升预测准确性 [11] - 第一步为预测基因表达:输入化合物化学结构,GPS可预测其对细胞中基因表达的影响,预测范围覆盖2198个高置信度核心基因 [13] - 第二步为计算“逆转分数”:为疾病构建特征性基因表达“签名”,GPS计算化合物预测表达谱与疾病签名的匹配程度,给出Z-RGES分数,分数越负表示越可能逆转疾病表型 [13] - 第三步为优化与验证:基于蒙特卡洛树搜索的算法可对潜力化合物结构进行微调,以改善其类药性 [13] 在肝细胞癌中的应用与发现 - 研究团队对ZINC数据库中近700万个类药化合物进行虚拟筛选,发现了一个苗头化合物,其对肝癌细胞系的IC50值约为4μM,且对正常原代肝细胞无明显毒性 [14] - 通过结构优化得到化合物MSU-45302,其对三种肝癌细胞系的IC50值达到亚微摩尔水平,活性强于一线靶向药索拉非尼 [14] - 研究提出了“结构-基因-活性关系”新概念,揭示MSU-45302可能通过抑制在肝癌中高表达的不良预后标志物UHRF1蛋白来发挥作用 [14] 在特发性肺纤维化中的应用与发现 - 研究团队整合单细胞和bulk RNA-seq数据,构建了涵盖上皮细胞、间充质细胞、免疫细胞等多种细胞类型的IPF特征图谱 [14] - GPS平台发现了老药吡乙二酮能够有效逆转IPF相关的多细胞类型基因表达特征,效果与FDA已批准的尼达尼布相当 [15] - 平台从Enamine HTS库中筛选出全新化合物Drug 18,该化合物在多个患者样本中能稳定降低FN1、SMA、CTHRC1等核心纤维化标志物的表达 [15] 该研究的意义与行业影响 - GPS平台直接从疾病基因表达特征出发进行“逆向工程”寻找药物,不依赖于对疾病机制的完全了解,大大扩展了化学空间的探索范围 [18] - 该方法能够发现全新机制的化合物并实现“老药新用”,有望使未来药物研发变得更加高效和精准 [18] - 对于肝癌治疗,AI设计的全新机制、高选择性药物可能加速治疗从“活得久”向“无瘤生存”迈进 [18] - 对于特发性肺纤维化等罕见病,AI平台能大幅降低早期药物发现的成本和风险,激发研发动力 [18]
Cell:中国学者开发AI药物发现与设计平台GPS,一作已回国加入临港实验室
生物世界·2026-03-18 12:37