微软研究院BioEmu登上Science,用生成式AI重塑蛋白质功能研究
微软BioEmu生成式深度学习模型研究 - 微软研究院AI for Science团队在《Science》发表论文,提出名为BioEmu的生成式深度学习模型,能高效模拟蛋白质构象变化 [1][6] - 该研究为理解蛋白质功能机制和加速药物发现开辟新路径 [6] 技术突破与创新 - BioEmu结合AlphaFold静态结构、200毫秒分子动力学模拟数据和50万条蛋白稳定性实验数据训练而成 [8] - 模型可在单张GPU上每小时生成上千个独立蛋白质结构 [8] - 基于扩散模型架构,结合AlphaFold的evoformer编码器和二阶积分采样技术 [12] - 能模拟蛋白质功能过程中的关键结构变化,如隐性口袋、局部解折叠和结构域重排 [12] - 自由能预测误差达1 kcal/mol,与实验数据高度一致 [14] - 对突变体稳定性变化预测表现出色,平均绝对误差低于1 kcal/mol,Spearman相关系数超0.6 [16] 应用与资源开放 - 研究团队在GitHub和HuggingFace开源模型参数和代码 [19] - 发布超过100毫秒的MD模拟数据,涵盖数千个蛋白系统和数万个突变体 [19] - 模型已部署在Azure AI Foundry和ColabFold等平台 [19] 未来发展前景 - 当前主要建模对象为单体蛋白质,未来计划扩展到蛋白质复合物、蛋白-配体相互作用等更复杂生物体系 [21] - 有望成为连接结构与功能、理论与实验的桥梁,应用于蛋白质科学、药物设计和合成生物学等领域 [21]