AI蛋白质研究

搜索文档
蛋白质结构预测/功能注释/交互识别/按需设计,中国海洋大学张树刚团队直击蛋白质智能计算核心任务
36氪· 2025-07-01 15:53
蛋白智能计算体系概述 - 蛋白质是生命活动的主要承担者,在人体生理功能中扮演关键角色,但传统研究面临结构解析成本高昂、功能注释滞后、设计效率低下等挑战 [1][3] - AI技术突破为蛋白质研究带来革新,2024年诺贝尔化学奖授予AI蛋白质结构预测与设计领域,凸显其重要性 [3] - 蛋白智能计算体系通过数据驱动算法实现对蛋白质复杂特性的高效模拟,为药物发现和生命系统模拟提供新路径 [1][3] 蛋白质结构预测突破 - AlphaFold系列模型实现从单体预测到复合物预测的飞跃:初代模型在CASP13中准确预测25种蛋白质结构(第二名仅3种),二代模型发布2.14亿蛋白质单体预测数据库,三代模型扩展至蛋白质-核酸-小分子复合物预测 [4][5] - AlphaFold3预测结构与电镜解析结果的平均误差不超过一个原子宽度,覆盖PDB数据库几乎所有分子类型 [5] 蛋白质功能注释技术 - 全球2.5亿条蛋白序列中仅0.5%完成精准功能注释,团队利用AlphaFold2预测的虚拟结构数据扩充训练样本至数亿级,突破电镜数据稀缺瓶颈 [6] - 提出自监督图注意力方法,通过编码残基关联信息使功能预测性能超越传统方法,在7个数据集上达到SOTA结果 [7][9][10] 蛋白质交互识别应用 - 自研模型解决AlphaFold3商业使用限制问题,引入孪生学习与协同机制,实现蛋白-核酸-小分子交互预测,胰腺癌信号通路预测准确率超95% [16] - 开发几何深度学习方法解决三维信息丢失问题,筛选出nM级别亲和力候选化合物,湿实验初步验证预测结果 [17][20] 蛋白质设计创新 - 蛋白质设计作为折叠逆问题面临搜索空间爆炸挑战,AI技术已实现全新蛋白质设计案例,如中和蛇毒毒素的特异性结合蛋白 [22] 生命系统跨尺度计算 - 构建"表征-状态-尺度"三维计算体系,涵盖基因-蛋白质-信号通路-细胞四级尺度,实现从原子到细胞的全链条模拟 [23] 团队技术成果 - 发表论文30余篇,Google Scholar引用超1,600次,研究成果发表于IEEE JBHI、JCIM、npj Systems Biology等权威期刊 [25]
抽一次血预知百病成为现实!我国AI蛋白质研究取得一系列重大成果
环球网资讯· 2025-06-03 20:20
蛋白质研究行业 - 人类目前仅了解20万~30万个蛋白质结构,占总数比例极低,AI正加速这一探索过程[1] - 蛋白质研究是破解人类疾病的终极钥匙,AI技术显著提升了研究效率[3] - 全球公开蛋白质结构数据积累达23万~30万个,成为AI大模型训练的重要语料库[12] AI蛋白质预测技术 - AlphaFold模型通过预测蛋白质静态结构获得诺贝尔化学奖[4] - 中国研发的OpenComplex2模型可预测动态蛋白质结构,功能超越AlphaFold[6] - 微观生命大模型不仅能预测蛋白质形状,还能模拟其随时间的变化和相互作用[8] - 新型AI算法将蛋白质序列预测精度提升45%,速度加快80倍[35] 医疗应用突破 - 通过单次血液蛋白检测可预测数百种疾病风险,研究成果登上《细胞》封面[17] - AI算法可高效提取蛋白质特征,构建精确疾病预测模型[17] - 已建立1706种人类疾病与蛋白质表达的关联数据库[19] - 发现帕金森病新基因靶点,相关药物已进入临床前研究阶段[24][26] 蛋白质设计技术 - Venus大模型可优化改造蛋白质,满足产业需求[36] - AI系统具备"挖酶"和"定向进化"两种能力,可筛选和改造功能蛋白[39] - 训练数据库包含近90亿条蛋白质序列和数亿功能标签[41] - 设计结果可在12小时内返回,经2-3轮微调即可获得优质突变体[43] 产业化成果 - 8个AI设计蛋白已进入产业化阶段[45] - 耐碱性抗体稳定性提高4倍,年节省成本上千万元[45] - 急性胰腺炎检测酶成本降至国际同类产品10%,实现吨级生产[45]