Workflow
蛋白质结构预测/功能注释/交互识别/按需设计,中国海洋大学张树刚团队直击蛋白质智能计算核心任务
36氪·2025-07-01 15:53

蛋白智能计算体系概述 - 蛋白质是生命活动的主要承担者,在人体生理功能中扮演关键角色,但传统研究面临结构解析成本高昂、功能注释滞后、设计效率低下等挑战 [1][3] - AI技术突破为蛋白质研究带来革新,2024年诺贝尔化学奖授予AI蛋白质结构预测与设计领域,凸显其重要性 [3] - 蛋白智能计算体系通过数据驱动算法实现对蛋白质复杂特性的高效模拟,为药物发现和生命系统模拟提供新路径 [1][3] 蛋白质结构预测突破 - AlphaFold系列模型实现从单体预测到复合物预测的飞跃:初代模型在CASP13中准确预测25种蛋白质结构(第二名仅3种),二代模型发布2.14亿蛋白质单体预测数据库,三代模型扩展至蛋白质-核酸-小分子复合物预测 [4][5] - AlphaFold3预测结构与电镜解析结果的平均误差不超过一个原子宽度,覆盖PDB数据库几乎所有分子类型 [5] 蛋白质功能注释技术 - 全球2.5亿条蛋白序列中仅0.5%完成精准功能注释,团队利用AlphaFold2预测的虚拟结构数据扩充训练样本至数亿级,突破电镜数据稀缺瓶颈 [6] - 提出自监督图注意力方法,通过编码残基关联信息使功能预测性能超越传统方法,在7个数据集上达到SOTA结果 [7][9][10] 蛋白质交互识别应用 - 自研模型解决AlphaFold3商业使用限制问题,引入孪生学习与协同机制,实现蛋白-核酸-小分子交互预测,胰腺癌信号通路预测准确率超95% [16] - 开发几何深度学习方法解决三维信息丢失问题,筛选出nM级别亲和力候选化合物,湿实验初步验证预测结果 [17][20] 蛋白质设计创新 - 蛋白质设计作为折叠逆问题面临搜索空间爆炸挑战,AI技术已实现全新蛋白质设计案例,如中和蛇毒毒素的特异性结合蛋白 [22] 生命系统跨尺度计算 - 构建"表征-状态-尺度"三维计算体系,涵盖基因-蛋白质-信号通路-细胞四级尺度,实现从原子到细胞的全链条模拟 [23] 团队技术成果 - 发表论文30余篇,Google Scholar引用超1,600次,研究成果发表于IEEE JBHI、JCIM、npj Systems Biology等权威期刊 [25]