Workflow
De-novo Protein Design
icon
搜索文档
MIT团队开源BoltzGen,可跨分子类型设计蛋白结合物,66%靶标获纳摩尔级亲和力
36氪· 2025-10-27 15:31
技术突破与核心创新 - 推出全原子生成模型BoltzGen,以几何连续表示替代传统离散残基标签,实现蛋白折叠与结合体设计的联合训练[1][2] - 构建灵活的设计规范语言,使模型可在蛋白质、纳米抗体、环肽、小分子等不同体系中灵活切换,实现跨分子类型的可控生成[1][3] - 在单一模型中统一结构预测与结合体设计,在原子级精度下同时完成蛋白折叠、结合位点建模与序列生成,提升设计的物理合理性与可控性[3] 模型架构与训练策略 - 模型架构分为Trunk主干网络和Diffusion Module扩散模块两部分,Trunk负责生成条件控制的表征,扩散模块通过多次迭代对带噪声的三维原子坐标进行去噪以生成稳定构象[10][11] - 训练采用多层次、跨模态的联合训练框架,数据集核心来源包括Protein Data Bank的高质量实验解析结构、AlphaFold Database的预测数据以及Boltz-1模型生成的复合结构样本[7] - 通过随机裁剪与多任务化处理,使模型在每次训练迭代中随机承担折叠预测、结合体设计等任务,实现统一的多功能学习框架[9] 实验性能与验证结果 - 在8个独立湿实验验证项目的26个靶标测试中,纳米抗体与蛋白结合体设计均有66%的目标获得纳摩尔级亲和力[2][12] - 在5个包含已知结合结构的基准靶标测试中,取得80%的靶标出现纳摩尔级结合体的高命中率[21] - 针对细菌DNA回旋酶GyrA的抗菌肽设计中,超过19%的候选序列能使细菌生长下降四倍以上,部分肽能直接杀灭宿主细胞[19] - 针对急性髓系白血病相关蛋白NPM1,生成的多肽在活细胞中表现出核仁共定位,提供首个体内证据支持AI设计蛋白可与天然无序蛋白结合[15] 行业发展与系列演进 - Boltz-1模型在性能上接近AlphaFold3,且完全开源可商用,推动分子结构预测进入开放生态,极大降低了生物计算的进入门槛[26] - Boltz-2模型在生成精度和计算效率上实现显著提升,引入多模态条件化输入,能够整合序列信息、实验数据及化学性质,实现更精细的分子设计[27] - BoltzGen作为最新一代模型,其统一的全原子生成架构使设计—预测—验证流程融为一体,为药物发现与生物分子工程提供开放、可控且可扩展的AI基础设施[25][29]