Workflow
蛋白质设计
icon
搜索文档
精准锁定治疗疾病的靶点 人工智能助力蛋白质“按需定制”
央视新闻· 2026-02-14 20:03
人工智能在科研领域的应用与赋能 - 人工智能正加速融入科研全流程,重塑科研底层逻辑、重构科研范式,助力科学研究进程全面提速[6] - 从医药、能源材料到航空航天,越来越多科研的关键环节被人工智能算法重构,催生出众多打破传统研发效率上限的成果[6] - 除了计算体系的革新,人工智能还在深度改造实验的方式,例如融合具身智能技术的全自动“黑灯实验室”已实现24小时不间断运转[6] 蛋白质设计与新药研发 - 西湖大学科研人员开发了一种全新的生成式大模型,可以从零开始设计具有全新功能的蛋白质,并已取得多项新发现,例如找到了一种有望用于治疗阿尔茨海默病的全新蛋白酶[1] - 人工智能可以基于海量数据构建蛋白质结构与功能间的对应关系,科研人员设定目标后,大模型能进行计算推演并给出可能的蛋白质设计方案供筛选与验证[1] - 清华大学团队开发的人工智能驱动“超级药物搜索引擎”,将过去可能数百年的新药筛选工作量压缩至一台电脑单日即可完成,整体效率提升上百万倍[3] - 该“超级药物搜索引擎”首次实现了全基因组规模的小分子药物模拟筛选,对上万个靶点和数亿级的候选分子进行系统匹配,并构建了目前全球规模最大的蛋白-配体筛选数据库[3] - 以抑郁症相关靶点为例,该大模型筛选出的候选药物实测有效率达15%,远超传统方式筛选出的水平[3] 人工智能赋能可控核聚变研究 - 我国商业可控核聚变团队利用人工智能实现了千秒量级的等离子体电流长脉冲运行,其“洪荒70”装置成功实现了1337秒稳态长脉冲等离子体运行,该成果在全球商业聚变公司中尚属首次[4] - 本轮装置运行周期两个多月共进行5000多次实验,单次实验信息量高达数TB,用这些数据训练的人工智能模型可高效参与实验的控制决策[4] - 使用人工智能可把实时推演的计算成本降到最低,实现毫秒级别的推演,并能通过大参数很好地描述复杂体系,捕捉其关键特性[4] - 人工智能可以对磁体电流、电压、加热功率等多项关键参数进行联合调控,结合仿真和实验数据优化策略,将原本需要一到两年的装置实验周期缩短至几个月[5] 当前技术局限与挑战 - 人工智能赋能蛋白质研究目前存在技术局限,由于大多数大模型训练数据主要是静态蛋白质结构数据,因此目前还难以模拟出蛋白质复杂动态的活动过程[2] - 科研人员须具备对问题敏锐的发现能力、利用各种大模型的综合能力等,才能更好地利用人工智能加速科学研究[2]
专访西湖大学卢培龙:AI蛋白质设计目前还无需严格监管,否则可能减缓科学进步
生物世界· 2025-12-24 16:00
文章核心观点 基于机器学习的人工智能工具正在彻底改变蛋白质结构研究和设计领域,以AlphaFold、RoseTTAFold等为代表的工具在预测精度和应用范围上取得了显著进展,但行业在预测蛋白质动态特性、复杂复合物、膜蛋白及功能设计方面仍面临挑战,未来需要整合多尺度数据、结合物理原理并开发更丰富的数据集以推动该领域向功能化、动态化设计迈进 [1][2][3] 蛋白质建模工具的进展与现状 - 机器学习工具正推动蛋白质建模取得重大进展,已超越单一结构预测,开始着手理解大分子动态和功能 [2] - AlphaFold引领了全球热潮,使结构信息成为更普遍的实验设计考量因素 [2] - AlphaFold3和RoseTTAFold All-Atom等最新模型显著提升了预测精度与范围,能够涵盖包含核酸、小分子配体和翻译后修饰的复合物体系,实现复杂生物系统模拟和功能元件的从头设计 [3] - 生成或设计工具变得更容易使用,能够更快地设计出新的蛋白质序列,且成功率更高 [2] 当前工具的局限性及挑战 - **蛋白质复合物**:对于大型、复杂、动态或瞬时存在的复合物,尤其是涉及构象变化或较弱相互作用界面时,预测仍存在显著挑战 [4] - **膜蛋白**:能够为许多跨膜蛋白生成高精度模型,但在应用于大型、动态或瞬时的膜蛋白复合物时面临局限性 [4] - **部分结构化或固有无序蛋白**:大多数预测工具表现不佳,常将无序区域错误折叠成非天然构象 [4] - **根本障碍**:主要在于这些体系的高分辨率实验数据稀缺,以及缺乏量化预测成功的明确标准 [4][5] - **动态与折叠路径**:当前工具无法预测折叠路径,也未明确纳入pH值、温度等溶液条件变量,预测动力学存在根本性局限 [6][9] - **功能性质设计**:在捕捉蛋白质功能的动态特性方面仍存在不足,准确预测和控制结合亲和力仍然困难,设计酶活性和小分子结合是极具挑战性的问题 [10][11][12] 未来发展的关键需求与方向 - **数据整合**:需要将深度学习与分子动力学模拟、交联蛋白质组学数据、深度序列比对共进化信号相结合 [4] - **多尺度方法**:发展多尺度方法与多模态学习技术对于推动蛋白质功能表征研究至关重要 [10] - **数据集扩展**:需要纳入更多功能性、生物物理测量数据(如结合亲和力、催化速率)以及捕获动态和多态构象的数据,系统整理并分享失败的设计数据也至关重要 [15] - **模型结合**:未来的方向在于将捕捉序列层面功能约束的蛋白质语言模型,与考虑几何结构、能量学和动力学的基于结构的物理模型相结合 [11] - **混合计算工具**:开发整合机器学习与分子动力学、密度泛函理论等计算方法的混合工具是自然趋势,例如AI 2 BMD系统能以从头算精度对超过10000个原子的大型生物分子进行全原子模拟 [17][18] 生成式AI在蛋白质设计中的应用与挑战 - 生成式AI取得了惊人进展,RFdiffusion与ProteinMPNN等技术影响力显著,最新版RFdiffusion3能以原子分辨率生成受配体、核酸等约束的蛋白质结构 [13] - 挑战在于许多生成式设计仍会产生大量不可行方案,效率有待提高,且设计具有动态构象或多功能状态的蛋白质仍然十分困难 [13][14] - 小分子设计相关的问题仍然极具挑战性,基于机器学习的工具是否在药物设计领域取得变革性进展尚存争议 [13] 前沿领域与未来展望 - **动态膜蛋白设计**:动态膜蛋白(如转运体和受体)的从头设计是一个令人兴奋的前沿,可能在合成生物学、生物传感和靶向治疗方面带来革命性进展 [22] - **蛋白质动力学**:预测蛋白质动力学是下一个前沿领域,预测结构集合及其在不同条件下的变化将是一项里程碑成就 [22] - **治疗应用**:预测生物制剂的“可开发性”及其免疫原性,以及从头设计可常规用作药物且避免免疫原性的蛋白质,将彻底改变疗法开发 [23]
我国科学家在离子通道精确从头设计领域再获突破
环球网资讯· 2025-10-21 10:08
研究突破核心观点 - 西湖大学研究团队实现两项世界首次突破:首次实现电压门控阴离子通道的精确从头设计,首次完成人工设计离子通道蛋白的体内实验 [1] - 该研究推动蛋白质设计领域实现重要突破,从设计静态结构膜蛋白跨越到设计具有动态响应能力的跨膜蛋白 [1][4] - 研究成果展示了蛋白质从头设计的巨大潜力,为开发能够调控细胞和神经活动的人工设计离子通道蛋白药物奠定基础 [4] 技术挑战与设计方法 - 设计天然电压门控离子通道难度极高,需同时满足稳固镶嵌细胞膜、具备电压感应、精准筛选离子以及实现动态响应等条件 [3] - 研究团队结合传统蛋白质设计算法与深度学习方法,从头生成五聚体跨膜蛋白,其俯视形状如五瓣紫荆花,正面呈倒漏斗型,为实现门控和单向运输提供理想基础 [3] - 关键的闸机设计通过在通道特定位置引入三层精氨酸实现,使其兼具电压传感器和离子选择过滤功能 [3] 实验验证与功能特性 - 实验结果显示,当电压达到40毫伏时,电流曲线显著上升,且电压越高闸机开放概率越大,完全符合电压门控的设计初衷 [3] - 所设计的通道仅允许阴离子通过而不能通过阳离子,具备离子筛选功能 [3] - 在体内实验中,将人工通道植入小鼠大脑神经元后,小鼠神经元放电频率显著降低,证明人工设计的离子通道蛋白可在生理条件下发挥作用 [4]
刚刚,2025年诺贝尔化学奖揭晓!
券商中国· 2025-10-08 21:35
2025年诺贝尔化学奖获奖者及贡献 - 2025年诺贝尔化学奖授予北川进、理查德·罗布森和奥马尔·M·亚吉,以表彰他们在金属有机框架领域的发展 [1] - 北川进专注于金属有机框架材料的基础研究和应用开发 [3] - 理查德·罗布森为金属有机框架的理论基础做出重要贡献 [6] - 奥马尔·M·亚吉在金属有机框架的合成方法和实际应用方面取得重大突破 [9] 诺贝尔化学奖历史数据 - 截至2024年10月,诺贝尔化学奖已颁发116次,有197位获得者 [12] - 奖项分布情况为63次由1人获得,25次由2人分享,28次由3人共享 [12] - 最年轻得主为让·弗雷德里克·约里奥-居里,获奖时35岁 [12] - 最年长得主为约翰·古迪纳夫,获奖时97岁,其研究彻底改变了手机、电脑及电动汽车的充电方式 [12] 近三年诺贝尔化学奖获奖回顾 - 2024年奖项一半授予大卫·贝克,另一半共同授予德米斯·哈萨比斯和约翰·江珀,以表彰他们在蛋白质设计和蛋白质结构预测领域的贡献 [13] - 2023年奖项授予莫吉·巴旺迪、路易斯·布鲁斯和阿列克谢·埃基莫夫,以表彰他们发现和合成量子点 [14] - 2022年奖项授予卡罗琳·贝尔托齐、莫滕·梅尔达尔和卡尔·巴里·夏普利斯,以表彰他们在发展点击化学和生物正交化学方面的贡献 [15]
Nature系列综述:乔治·丘奇绘制 AI 蛋白质设计路线图,逐步指导利用AI工具设计蛋白质
生物世界· 2025-09-14 12:05
AI驱动蛋白质设计的革命性进展 - AI彻底改变了蛋白质设计方式 以前所未有的精准度和速度设计具有定制功能的新型蛋白质 将蛋白质设计从反复试验过程转变为预测性学科 [2][7][9] - 蛋白质序列空间极其庞大 典型350个氨基酸组成的蛋白质有约10^455种可能序列 远超可观测宇宙总原子数量(约10^82个) 传统方法无法高效遍历 [6] - AI工具在定向进化中准确预测有益突变 从序列预测功能 在理性设计中以接近实验精度从序列预测结构 并从头生成新蛋白质 [7] 蛋白质设计策略与AI增强 - 传统蛋白质设计主要依赖定向进化和理性设计两种策略 定向进化通过随机突变和筛选模拟自然选择 理性设计基于结构和功能数据进行针对性修改 [6] - 定向进化费时费力 理性设计受限于结构信息可用性和准确性 两种方法都无法高效遍历巨大序列空间 [6] - AI增强这两种策略: 在定向进化中缩短实验周期 在理性设计中实现无模板结构预测和蛋白质生成 生物分子共折叠模型可预测多分子复合物 [7] AI工具包分类与应用 - AI工具分为七大工具包: T1蛋白质数据库搜索 T2结构预测 T3功能预测 T4序列生成 T5结构生成 T6虚拟筛选 T7DNA合成 [17][22] - T2结构预测包括单链折叠(AlphaFold2 ESMFold) 复合物预测(RoseTTAFold AF-Multimer) 生物分子共折叠(NeuralPLexer) 结构稳定性预测 [21] - T4序列生成包含进化引导(UniRep ESM系列) 功能到序列(ProGen POET) 结构到序列(ProteinMPNN ESM-IF)三种生成方式 [21] 蛋白质设计工作流程 - 蛋白质设计项目从明确目标开始 通过功能 结构和可开发性三个维度评估 指导设计策略制定 [16] - 工作流程分为三个阶段: 确定策略(定向进化或理性设计) 库设计(设计序列文库) 筛选与优化(实验验证) 形成迭代循环 [16] - AI工具支持每个工作流程阶段 从策略定义到蛋白质数据库搜索 结构功能预测 序列结构生成 虚拟筛选和DNA合成 [17] AI驱动案例研究 - AAV衣壳定向进化中 AI模型从10^10个序列的虚拟文库中筛选出20426个序列 其中110689个(58.1%)实验验证为存活 包含最多29个突变的设计 [27] - 抗体定向进化使用ESM模型生成突变体 两轮过程后四个抗体结合亲和力提高多达7倍 三个不成熟抗体提高多达160倍 [27] - 从头设计荧光素酶使用trRosetta生成新NTF2框架 ProteinMPNN优化序列 LuxSit变体表现出色 热稳定性>95°C且具有高度特异性 [28] 技术挑战与未来方向 - 训练数据偏差或缺失会扭曲预测结果 需要全面训练库 严格验证和偏差缓解策略 动态整合新实验数据 [29][30] - 可解释性是关键障碍 许多AI工具如黑箱运作 需要可解释AI方法阐明设计基础 稀疏自动编码器显示发现可解释特征的前景 [30] - AI有望开启精准治疗新时代 将"不可成药"靶点向蛋白质药物开放 微调结合特异性 增强稳定性 溶解性和可制造性 [31] - AI开始设计自然界不存在的全新蛋白质和生物系统 如family-wide hallucination RFDiffusion和AlphaProteo策略实现高精度从头生成结合蛋白 [32]
Nature:蛋白质设计新革命!AI一次性设计出高效结合蛋白,免费开源、人人可用
生物世界· 2025-08-29 12:29
技术突破 - 开发名为BindCraft的开源自动化蛋白质从头设计平台 实现功能性结合蛋白的一次性计算设计 无需实验优化或高通量筛选 [2][3] - 通过逆向改造AlphaFold2模型 利用反向传播算法从目标蛋白结构直接生成匹配的全新结合蛋白 颠覆传统耗时数月且成功率不足1%的方法 [2][5] - 采用动态建模同步优化靶点与结合蛋白结构 智能进化迭代优化表面氨基酸 双重过滤机制确保设计可靠性 [5] 性能表现 - 设计成功率高达10%-100% 平均达46.3% 结合强度达纳摩尔级 相当于抗体药物水平 [2][3][5] - 成功靶向细胞表面受体(PD-1/PD-L1/IFNAR2/CD45) 常见过敏原(Bet v1/Der f7/Derf 21) 从头设计蛋白质及多结构域核酸酶(CRISPR-Cas9) [3][7] 应用验证 - 设计桦树花粉过敏原Bet v1结合蛋白 患者血清测试显示阻断50%过敏抗体结合 [7] - 针对尘螨过敏原Der f7和Derf 21设计的结合蛋白 晶体结构证实与设计模型误差仅0.3纳米 [7] - 设计Cas9抑制蛋白精准结合REC1核酸结合域 显著降低HEK293细胞基因编辑活性 [8] - 中和产气荚膜梭菌穿孔毒素CpE 完全消除毒素导致的细胞死亡 效果等同天然抑制剂 [8] - 设计靶向HER2和PD-L1的微型结合蛋白整合至AAV衣壳 实现特异性靶向癌细胞 [8] 行业影响 - 实现"one design-one binder"方法突破 在治疗学 诊断学和生物技术领域具有巨大潜力 [3][9] - 开源技术使普通实验室可设计定制蛋白质 有望重塑药物开发 疾病诊断和治疗领域未来 [9]
Nature Chemistry:西湖大学曹龙兴团队实现可逆光响应蛋白的从头设计
生物世界· 2025-08-28 18:00
研究背景与挑战 - 蛋白质设计领域在2024年迎来高光时刻 蛋白质设计先驱David Baker教授获得诺贝尔化学奖 人工智能技术加持下领域发展突飞猛进 [5] - 编程设计全新环境响应蛋白质仍面临重大挑战 需实现不同结构状态切换 光响应性因瞬时性 非侵入性和可逆调控性成为特别机制 [5] - 天然光响应蛋白质存在持续光照需求 逆向过程耗时长 光响应作用单一 折叠复杂 分子量大 波长固定 热稳定性有限等局限性 [6] - 改造天然光蛋白质存在工程化困难 光感应谱和动力学控制复杂 异源系统表达难度大等问题 [6] - 传统蛋白质设计依赖20种标准氨基酸 这些氨基酸对光照不敏感 需光敏感色素基团并协调发色团激发与构象转换的相互作用 [6] 技术突破与创新 - 研究团队开发整合AI深度学习的蛋白质对接程序 适用于非天然氨基酸 通过密码子扩展技术整合光响应非天然氨基酸AzoF [3][7] - 实现精确设计可逆光响应性蛋白质 包括同源多聚体和异源二聚体等多种对称性特征复合体 [3][7] - 设计方法结合基于物理能量的蛋白质对接与AI深度学习 首次从头设计出结构丰富多样的光响应蛋白质 [12] 性能特征与优势 - 光响应蛋白能在不同光照条件下快速切换复合物状态与单体态 异源二聚体LRD-7亲和力变化达167倍 [8] - 蛋白质单体仅由65个氨基酸构成 分子量小 可作为光控标签工程化靶蛋白 [8] - 具备极强热稳定性 95°C加热恢复后保持原有二级结构 未经优化产量达40 mg/L [8] - 设计出的同源寡聚光响应蛋白可制备光响应性蛋白水凝胶 具备优良固态-液态转化特性 [10] - 光响应异源二聚体可控制受体传递的基因表达信号 [10][14] 研究意义与应用前景 - 研究为光调控蛋白-蛋白相互作用的从头设计提供新方法和思路 [12] - 为从头设计光响应靶标结合蛋白和光响应分子机器奠定坚实基础 [12] - 验证了在生物材料和细胞信号通路方向的广泛应用潜力 [12]
David Baker最新论文:AI从头设计大环肽,高亲和力靶向目标蛋白
生物世界· 2025-06-23 14:58
蛋白质设计领域新突破 - 开发了从头设计大环肽的新框架RFpeptides 实现了精确设计与目标蛋白质具有高亲和力的大环肽 [3] - 该研究由诺贝尔奖得主David Baker团队发表在Nature Chemical Biology 标志着蛋白质设计领域的重要进展 [2] 大环肽的 therapeutic potential - 大环肽介于小分子药物和大分子生物制剂之间 能够调控传统治疗手段无法触及的分子靶点 [6] - 生物制剂限于细胞外靶点 小分子难以靶向缺乏深疏水口袋的蛋白质 大环肽可填补这一治疗空白 [6] - 传统肽类药物研发依赖天然产物发现或高通量筛选 存在合成困难 稳定性差 耗时耗资等局限 [6] RFpeptides技术优势 - 扩展RoseTTAFold2和RFdiffusion框架 引入循环相对位置编码 实现基于去噪扩散的大环肽设计流程 [12] - 针对MCL1 MDM2 GABARAP RbtA四种蛋白质测试 均获得中高亲和力结合剂 其中RbtA结合剂Kd<10nM [13] - X射线晶体显示设计的大环肽-靶蛋白复合物结构与计算模型高度吻合 Cα RMSD<1.5Å [14] 人工智能在蛋白质设计的应用 - 生成式AI突破被用于大环结合剂设计 RFdiffusion模型已成功设计蛋白质单体及结合剂 [10] - 现有AI方法因训练数据有限难以直接应用于肽设计 RFpeptides框架克服了这一挑战 [11] - 该技术为快速定制诊断/治疗用大环肽提供系统性框架 具有广泛 therapeutic application [16]