ESMFold
搜索文档
AI预测蛋白结构新突破:崔振团队开发TDFold,性能更优、速度更快,资源消耗更低
生物世界· 2026-04-09 12:15
文章核心观点 - 北京师范大学研究团队提出名为TDFold的新方法,实现了从单序列进行高精度、高效率的蛋白质结构预测,其性能、速度和资源消耗均显著优于现有主流方法,有望大幅降低该领域的计算门槛并加速相关研究[3][4][5] 技术背景与现有方法局限 - AlphaFold2虽掀起革命并获诺贝尔奖认可,但其关键限制在于需要大量同源序列信息作为输入,导致计算成本高[2][3] - 现有顶级预测模型主要分两类:依赖同源信息的模型(如AlphaFold2/3、RoseTTAFold)和蛋白质语言模型(如ESMFold、OmegaFold)[10][11] - 依赖同源序列的方法计算成本巨大:预测一个500氨基酸的蛋白质,AlphaFold2需近1000秒,占用12GB GPU,且对缺乏同源序列的“孤儿蛋白”性能大幅下降[10] - 蛋白质语言模型虽摆脱同源序列依赖,但模型庞大复杂:ESMFold预测同样蛋白质需约100秒,占用20GB GPU[10] TDFold方法的核心创新 - 提出名为TDFold的二维几何模板扩散方法,用于生成高质量的成对几何特征(距离和方向),以实现精准高效的三维结构预测[4] - 工作流程分为两步:1) 二维几何模板生成:将蛋白质序列作为“文本提示”,通过改进的扩散模型生成几何蓝图,类似文生图技术;2) 序列-几何协同学习:使用轻量级图神经网络学习特征并预测三维原子坐标[14] - 采用LoRA微调技术,仅训练少量参数使Stable Diffusion模型适应蛋白质几何生成任务,大幅降低训练成本[14] TDFold的性能优势 - **预测性能更优**:在孤儿蛋白数据集Orphan上TM-score达0.46,优于ESMFold的0.42和AlphaFold2(全模式)的0.37;在Orphan25数据集上TM-score达0.61,明显高于ESMFold的0.54[20] - **在CASP基准测试中表现提升**:与ESMFold相比,在CASP14、15、16上TM-score分别提升0.02、0.01、0.02;与OmegaFold相比,在CASP15和CASP16上TM-score分别显著提升0.07和0.08[20] - **推理效率极高**:预测500个氨基酸的蛋白质仅需约10秒,速度比ESMFold快10倍,比AlphaFold2/3和RoseTTAFold快10-100倍[3][20] - **资源消耗显著降低**:GPU占用仅需约7GB,低于AlphaFold2的12GB、RoseTTAFold的16GB和ESMFold的20GB[3][20] - **训练成本低**:使用单张英伟达4090 GPU,一周内即可完成训练[20] 研究的实际意义与行业影响 - 大幅降低蛋白质结构预测门槛,使资源有限的高校和科研机构能使用消费级GPU在短时间内完成高质量预测,无需昂贵计算集群[5][18] - 为生物医学研究带来多重加速可能:快速解析新发现蛋白质结构以加速药物靶点识别、实时跟踪病毒蛋白变异以支持疫苗设计、大规模扫描蛋白质数据库以发现新功能模块[21] - 技术展示了跨领域融合的威力,将计算机视觉中的扩散模型创新性应用于结构生物学问题[19] - 预示未来发展趋势:在线预测服务响应时间可能从分钟级降至秒级、个人电脑也能运行高精度预测工具、实时动态的蛋白质折叠过程模拟成为可能[22][23]
扎克伯格承诺捐款超2000亿美元,加大AI投入,誓要攻克所有疾病
生物世界· 2025-11-12 17:00
陈-扎克伯格倡议(CZI)战略调整与资金承诺 - 扎克伯格夫妇成立的CZI目标是在本世纪末治愈、预防或管理所有疾病,最初承诺投入99%的财产(约450亿美元)[2] - 随着人工智能领域快速发展,扎克伯格身价暴涨,CZI资金承诺已攀升至超过2000亿美元[2][4] - CZI目前资金规模超过2200亿美元,远超霍华德·休斯医学研究所(256亿美元)、盖茨基金会(772亿美元)等生物医学慈善领域老牌巨头[4][5] CZI科研投入战略聚焦 - CZI已停止除科学领域外所有领域的资助,宣布加倍押注人工智能,更早实现治愈所有疾病的目标[4] - 在运营进入第二个十年之际,CZI计划在基础科学研究方面投入至少100亿美元,是第一个十年投入40亿美元的两倍还多[5] - CZI年度科研支出达10亿美元,已与霍华德·休斯医学研究所的年度投入相当[5] 人工智能与生物学融合新方向 - CZI重新调整目标,将原定"在本世纪末治愈、预防或管理所有疾病"改为"在本世纪末治愈、预防所有疾病"[5] - CZI启动新人工智能计划,旨在构建人类免疫系统虚拟模型,加快新疗法探索[6] - 任命麻省理工学院/哈佛大学博德研究所计算机科学家Alex Rives出任科学主管,其曾领导开发能够快速预测蛋白质结构的ESMFold和ESM2模型[6] 生成式AI模型突破性进展 - Alex Rives团队推出的ESM-3是第一个同时对蛋白质序列、结构和功能进行推理的生成式人工智能模型[6] - 使用ESM3生成了全新绿色荧光蛋白esmGFP,与天然绿色荧光蛋白只有58%序列同源性,模拟了5亿年进化过程[7] 机构重组与科研整合 - CZI将三个实验室和成像中心重新整合为非盈利科研机构Biohub,以上一轮估值数倍价格收购EvolutionaryScale公司[9] - 重组后的Biohub计划构建通用虚拟细胞模型,推动免疫学从描述性科学向预测性、工程化科学转变[9] - Biohub提出预测免疫学循环新范式,通过融合因果实验数据与生成式AI模型构建虚拟免疫系统[13][18] 免疫学研究范式变革 - 论文提出免疫学第三次革命,核心是预测免疫学循环,构建能够动态模拟和干预免疫系统的虚拟免疫系统[13] - 虚拟免疫系统最终目标是构建统一概念模型,使免疫学具备物理学"标准模型"般的解释力[18] - 该模型为解决自身免疫疾病、通用疫苗设计等重大免疫学挑战提供了清晰路线图[18]
苹果发布轻量AI模型SimpleFold,大幅降低蛋白质预测计算成本
环球网资讯· 2025-09-25 10:49
文章核心观点 - 苹果公司发布轻量级蛋白质折叠预测人工智能模型SimpleFold 该模型采用流匹配方法替代传统复杂模块 在保障预测性能的同时显著降低计算成本 有望推动药物研发与新材料探索 [1] 技术方法创新 - SimpleFold创新性采用流匹配方法 替代传统模型中依赖的多序列比对等计算密集型特定架构 [1] - 流匹配方法能直接从随机噪声中一次性生成蛋白质目标结构 有效跳过多步去噪环节 从而大幅减少计算量并显著提升生成速度 [4] - 该技术已在文本生成图像和3D建模等领域成功应用 其高效性得到验证 [4] 模型性能表现 - 研究人员构建了参数规模从1亿到30亿不等的多个SimpleFold模型版本 并在CAMEO22和CASP14两大权威基准测试中进行评估 [4] - 模型在CAMEO22测试中性能达到AlphaFold2和RoseTTAFold2的约95% [5] - 参数规模更小的SimpleFold-100M版本 在保持高效计算特性的同时 性能超过ESMFold的90% [5] - 测试结果显示SimpleFold性能稳定优于同类流匹配模型ESMFold 整体表现可与顶尖蛋白质折叠预测模型媲美 [4] 行业影响与意义 - 该模型显著降低了蛋白质折叠预测的硬件门槛 为更多科研团队开展相关研究创造有利条件 [1] - 精准的蛋白质折叠预测结果能为疾病机理研究和药物设计提供关键支撑 [1] - 此项成果证明了通用架构模块在蛋白质预测领域的可行性与竞争力 [5]