蛋白质结构预测

搜索文档
南开大学郑伟等开发蛋白结构预测新模型:AI+物理模拟,超越AlphaFold2/3
生物世界· 2025-05-26 16:38
蛋白质结构预测技术突破 - 南开大学郑伟教授团队开发了新型蛋白质结构预测工具D-I-TASSER,在CASP15比赛中表现优于AlphaFold2和AlphaFold3 [2][3] - D-I-TASSER成功预测了人类蛋白质组中19512个蛋白质,覆盖率达95%,能够折叠81%的蛋白质结构域和73%的全长序列 [3][12] - 该技术融合深度学习和物理模拟,实现了高精度的蛋白质结构和功能预测 [3] AlphaFold的局限性 - AlphaFold在多结构域预测方面存在短板,80%的人类蛋白质含多个结构域,传统方法常忽略域间相互作用 [6] - AlphaFold是静态模型,难以捕捉蛋白质动态变化,对缺乏同源序列的蛋白质预测能力骤降 [6] - 纯数据驱动方法可能丢失蛋白质折叠的底层物理规律 [6] D-I-TASSER技术创新 - 深度融合深度学习与物理模拟,整合多源信息并利用物理引擎迭代优化结构 [8] - 首创自动切割-独立预测-动态组装的流程,域内精度达0.858,较AlphaFold2提升2.8%,域间取向误差降低17% [8] - 采用升级版DeepMSA2搜索宏基因组数据库,多序列比对信息量提升6.75倍 [11] 技术性能表现 - 在CASP15盲测中,对困难靶标的预测精度比AlphaFold2高29.2% [11] - 成功解析超过3000个氨基酸残基的超大蛋白质,如新冠病毒刺突蛋白,捕捉开放/闭合双构象 [11] - 无序区域构象多样性比AlphaFold高59%,系统注释了ATP结合、铁硫簇组装等关键功能位点 [14][15] 当前挑战 - 对孤儿蛋白(同源序列<1%)预测精度降至0.67 TM-score [20] - 尚未涉及蛋白质复合体的结构预测 [20] - 计算耗时仍高于纯深度学习模型 [20]