Workflow
蛋白质语言模型
icon
搜索文档
西湖大学原发杰团队发布SaprotHub开源平台:让生物学家能够轻松应用蛋白质语言模型,
生物世界· 2025-10-27 18:00
该研究首先提出了一种新颖的蛋白质表征方法——将蛋白质一维序列与三维结构相结合形成"结构感知"词 汇表并据此训练出了 蛋白质语言大模型 —— Saprot 。在此基础上,团队进一步推出了 SaprotHub 开源 平台 。 该平台旨在将 Saprot 等一系列先进蛋白质语言模型的能力开放给生命科学领域研究者,它也是 开放蛋白 质模型联盟 (Open Protein Modeling Consortium,OPMC) 为推动全球科研协作、共建开源社区而迈 出的关键第一步。 编辑丨王多鱼 排版丨水成文 如同人类拥有语言,生命世界也有一套由氨基酸序列构成的"分子语言"—— 蛋白质 。近年来,人工智能 (AI) 领域的 蛋白质语言模型 (PLM) 展现出解码这套语言的强大能力,能够精准预测蛋白质的结构与 功能 。 然而,这些尖端模型的训练与使用,往往需要深厚的机器学习专业知识和编程能力,这在 AI 开发者与广大 生物学家之间形成了一道鸿沟。 为了打破这一壁垒, 2025 年 10 月 24 日, 西湖大学 原发杰 团队 在 Nature Biotechnology 期刊 发表 了题为: Democratizing Pr ...
Cell子刊:生成式AI模型,从头生成抗菌肽,对抗抗生素耐药难题
生物世界· 2025-09-07 12:03
行业背景与挑战 - 抗生素耐药性的发展速度已远超新型抗生素的发现能力 [2] - 抗菌肽作为传统抗生素的有前景替代品,具有广谱抗菌活性,但其发现过程面临巨大序列空间和复杂结构活性关系等挑战 [2] 技术突破:AMP-Diffusion模型 - 研究团队开发了一种名为AMP-Diffusion的潜在扩散模型,该模型基于蛋白质语言模型嵌入并对抗菌肽序列进行微调 [3] - AMP-Diffusion直接在源自ESM-2蛋白质语言模型的潜在空间上操作,无需对蛋白质潜在空间进行训练,实现了与基础模型的深度集成 [7] - 该模型能够通过系统地探索序列空间来快速发现抗菌肽候选物 [3] 研究成果与实验验证 - 使用AMP-Diffusion生成了50000个候选抗菌肽序列,并合成了46个排名靠前的候选肽进行验证 [8] - 76%的测试候选抗菌肽具有低毒性且能杀灭细菌 [9] - 验证显示候选抗菌肽具有广谱抗菌活性,包括对多重耐药菌株的活性,其主要作用模式为膜通透性和去极化 [8] - 在临床前小鼠模型中,先导抗菌肽降低了细菌载量,其疗效与多粘菌素B和左氧氟沙星相当,且未检测到不良反应 [8][9] 技术平台价值 - AMP-Diffusion为设计抗生素提供了一个强大的平台 [8] - 该研究展示了生成式人工智能与蛋白质语言模型结合在精确控制多肽属性方面的潜力 [7]
Nature Materials:清华大学高华健/邵玥团队团队提出“分子邮编”策略,多肽修饰LNP,实现mRNA的器官选择性递送
生物世界· 2025-09-02 16:30
技术突破 - 开发多肽编码器官选择性靶向(POST)方法 通过特定氨基酸序列调控脂质纳米颗粒(LNP)表面 实现全身给药后mRNA向肝外器官的高效特异性递送[4][7] - POST系统核心机制依赖于多肽序列与血浆蛋白结合亲和力的力学优化 形成特异性蛋白冠 分子动力学模拟证实其力学引导机制[4][9] - 该策略突破传统LNP电荷依赖的递送限制 器官选择性和递送效率对多肽编码序列呈现单个氨基酸级别的敏感性[7][9] 应用范围 - POST平台适用于多种LNP配方 支持多重mRNA递送及反义寡核苷酸(ASO)和基因编辑技术的肝外器官靶向[9] - 成功实现向肝脏、肺、脾脏、胎盘、骨髓、脂肪组织和睾丸等器官的选择性递送 显著拓宽器官靶向适用范围[4][9] - 基于人工智能框架开发Transformer蛋白质语言模型 生成对Vtn蛋白具高机械亲和力的多肽序列RRRYRR 实验证实可实现肺部选择性mRNA递送[9] 行业意义 - 为精准递送系统提供模块化可编程设计框架 实现自下而上的LNP表面工程化调控[4][11] - 多肽的数字化编程特性使LNP-环境界面调控更具理性设计范围 提升功能灵活性与治疗潜力[3][11] - 技术突破为疫苗、癌症治疗和再生疗法领域带来新发展机遇 推动非病毒mRNA递送系统临床转化[2]
Nature子刊:谈攀/洪亮团队开发蛋白质语言模型VenusMine,成功挖掘高效的PET水解酶
生物世界· 2025-07-08 16:18
塑料废弃物与PET降解酶研究 - 聚对苯二甲酸乙二醇酯(PET)是使用量最大的饮料包装材料,广泛应用于碳酸饮料、饮用水、果汁等包装瓶以及食品、化工、药品包装等领域,带来了重大环境挑战 [2] - 现有PET水解酶存在序列多样性狭窄、性能欠佳的问题,实际应用受限 [2] VenusMine蛋白质大模型 - 研究团队开发了基于蛋白质大模型的酶挖掘模型VenusMine,融合蛋白质语言模型(PLM)与三维结构分析 [6] - 该模型能通过蛋白质序列、结构和功能之间的隐含映射规则,在海量蛋白数据库中高效挖掘同源性低但功能优异的酶分子 [2] - 以IsPETase晶体结构为模板,VenusMine识别并聚类目标蛋白质,通过PLM评估溶解性和热稳定性筛选出34种蛋白质进行生化验证 [7] KbPETase酶的性能突破 - 从Kibdelosporangium banguiense发现的KbPETase表现出极高的催化效率和热稳定性 [3] - KbPETase的最适酶活是模板IsPETase的97倍 [3] - 在30-60°C范围内,14种候选蛋白质表现出PET降解活性,其中KbPETase的熔解温度比IsPETase高32°C [8] - KbPETase的催化效率超过了FastPETase和LCC [9] - X射线晶体学和分子动力学模拟显示KbPETase具有保守的催化结构域和增强的分子内相互作用,支撑了其功能和热稳定性的提升 [12] 研究方法与成果 - 研究展示了一种新颖的深度学习方法,用于发现具有增强性能的天然PET水解酶 [13] - 研究成果发表在Nature Communications期刊,题为"Harnessing Protein Language Model for Structure-Based Discovery of Highly Efficient and Robust PET Hydrolases" [2]
北京大学发表最新Cell论文
生物世界· 2025-05-28 15:30
研究背景与意义 - 活体动物体内精确控制蛋白质激活的通用策略对蛋白质功能增益研究至关重要[1] - 现有技术依赖复杂蛋白质构建体设计,可能改变目标蛋白质的天然功能和相互作用[4] - 生物正交断键反应(BCR)与遗传密码扩展(GCE)技术结合,可利用非天然氨基酸暂时掩蔽目标蛋白活性位点[4] 技术突破 - 开发CAGE-Prox vivo策略,通过引入反式环辛烯-酪氨酸(TCOY)暂时关闭蛋白功能,再通过小分子诱导恢复活性[7] - 利用机器学习流程进化出能精准识别TCOY的氨酰-tRNA合成酶突变体(PylRS)[7][10] - 采用3,6-二甲基-1,2,4,5-四嗪(Me2Tz)触发TCOY的生物正交剪切反应释放天然酪氨酸[10] 技术优势 - 体内操作无需紫外线,穿透深层组织[10] - 靶向递送与化学激活双重精准控制[10] - 通用平台可精准调控酶活性、蛋白质互作、抗体功能等[10] 应用场景 - 精准杀伤肿瘤细胞:通过EGF-PA靶向递送失活LF,Me2Tz激活后诱导肿瘤细胞凋亡[9] - 定向激活肿瘤细胞焦亡:重新激活LF触发Caspase3/8级联反应切割GSDME[11] - 构建更安全双特异性抗体:TCOY修饰抗CD3抗体避免细胞因子风暴,提高安全性[11] 研究意义 - 为活体条件下时间分辨生物学研究和按需治疗干预提供通用平台[13] - 实现活体动物中按需激活蛋白质及调控蛋白-蛋白相互作用[13]