研究背景与意义 - AI模型如AlphaFold2已能根据氨基酸序列预测蛋白质的单一稳定结构,但蛋白质在细胞内是动态变化的,其在不同构象状态间的转换对功能至关重要[2] - 全面捕捉蛋白质的构象全貌及其动态灵活性,对理解其功能仍是一大挑战[2] 研究成果发布 - 2026年2月25日,由华东理工大学、华东师范大学、复旦大学的研究团队合作在《自然-机器智能》期刊上发表了一项关于生成多样化蛋白质构象集合的研究[3] 核心模型:Mac-Diff - 研究开发了一个名为“模态对齐条件扩散模型”(Mac-Diff)的AI模型,用于生成未知蛋白质的构象集合[4] - Mac-Diff的核心创新是“局部感知模态对齐注意力”机制,该机制在蛋白质的氨基酸序列(条件视图)和三维结构(目标视图)之间建立精细的物理对应关系[8] - 模型利用来自ESM-2等蛋白质语言模型的语义丰富序列嵌入作为条件输入,这些嵌入能捕捉从进化模式、结构基序到功能特性的广泛信息[10] - Mac-Diff的架构基于分数扩散模型,采用U-Net结构,包含整合时间步嵌入和残基对表示的ResNet块,以及通过自注意力和LAMA-attention更新表示的Transformer块[10] 模型性能表现 - 在恢复快速折叠蛋白质的构象分布任务中,Mac-Diff在关键指标上优于现有扩散和流基模型:成对Cα原子距离分布的Jensen-Shannon散度降低了约18%,回转半径分布降低了22%,基于TICA的JS散度降低了5%[13] - Mac-Diff在生成的构象结构准确性和多样性之间取得了良好平衡,在12个测试蛋白质中的平均得分最高[13] - 该模型成功恢复了牛胰蛋白酶抑制剂(BPTI)仅在1毫秒长时分子动力学模拟中观测到的重要构象亚状态,并预测了腺苷酸激酶(AdK)的闭合与开放状态[15] - 在效率方面,Mac-Diff的采样速度比传统分子动力学模拟快约3000倍(超过三个数量级)[16] 应用与影响 - Mac-Diff标志着蛋白质结构预测从静态向动态的重要转变,有助于更好地理解蛋白质折叠动力学及序列、结构、功能间的复杂关系[18] - 模型预测构象异质性的能力将在基于结构的药物设计和蛋白质工程中发挥重要作用,有助于设计更有效的药物和开发具有新功能的蛋白质[18] - 该技术为增进蛋白质动力学和结构变异性认知提供了重要工具,对结构生物学、基于结构的药物设计及蛋白质工程具有广泛影响[4]
Nature子刊:李洪林/张凯/张捷团队开发AI模型Mac-Diff,生成蛋白质动态构象
生物世界·2026-03-04 12:37