药物发现
搜索文档
Nature子刊:刘振明/郑南宁等开发AI新模型,用于天然产物挖掘及相关药物发现
生物世界· 2026-05-08 12:11
研究背景与行业痛点 - 天然产物源自微生物、动物或植物的代谢产物,具有多样化的生物活性,对药物发现至关重要 [2] - 当前天然产物研究中的深度学习方法主要依赖针对特定下游任务设计的监督学习策略,这种“一任务一模型”的模式泛化能力不足且性能有较大提升空间 [2] - 现有的分子表征方法并不完全适用于天然产物特有的任务需求 [2] 核心研究成果 - 北京大学药学院与西安交通大学人工智能与机器人研究所的研究团队在《Nature Machine Intelligence》上发表了题为“Pretraining a foundation model for small-molecule natural products”的研究论文 [2] - 该研究开发了一个用于天然产物挖掘及相关药物发现的基础模型——NaFM [3] - NaFM采用专门针对天然产物设计的预训练策略,结合对比学习与掩码图学习目标,在捕捉侧链信息的同时突出分子支架中的进化信息 [4] - NaFM在与天然产物挖掘及药物发现相关的多项下游任务中取得了最佳性能 [4] 模型验证与应用展示 - 研究团队通过将分类学分类任务与专注于合成分子的基线模型比较,说明了现有模型在理解天然合成过程方面的不足 [4] - 通过在基因和微生物层面进行细粒度分析,NaFM展现出捕捉进化信息的能力 [4] - 研究团队将该方法应用于虚拟筛选,展示了其能够形成信息丰富的天然产物表征,从而更有效地识别潜在药物候选分子 [4] 行业评价与意义 - 《Nature Machine Intelligence》期刊为此发表了题为“Learning the chemical language of natural products”的News & Views文章,指出该研究开发出了一种有前景的基础模型,可用于天然产物挖掘的一系列下游应用 [5]
深度|谷歌DeepMind CEO:AI最好的用途,是改善人类健康;把AI当作一种工具,帮助我们理解现实世界的本质
Z Potentials· 2026-05-06 11:32
文章核心观点 - AI最重要的应用是作为推进科学和医学的终极工具,而非仅是消费级产品如聊天机器人[5] - 公司通过AlphaFold等项目,将AI用于解决基础科学难题,并免费开放成果以加速全球科研,特别是药物发现和疾病理解[5][7][8] - AI的发展路径应兼顾谨慎推进通用人工智能(AGI)与积极部署专用型系统,以尽早获得实际效益,如治疗癌症和发现新能源[5][25] - AI的创造力已在AlphaGo等系统中展现,这种能力可被泛化并应用于解决现实世界的复杂问题,如芯片设计、新材料发现和算法优化[33][34][37][38] - 对AI未来的主要担忧集中于技术滥用和强智能体失控问题,而非短期的炒作或虚假信息[5][40][41][43] - 构建AGI的最终愿景是将其作为工具,帮助人类理解现实本质、攻克科学根问题,并引领人类进入繁荣的新时代,如解决能源问题、走向太空[47][50][51] AlphaFold:改写科研流程与药物发现 - **项目起源与意义**:蛋白质折叠问题是生物学界持续50年的重大挑战,被称为“生物学界的费马大定理”,攻克它能极大推动药物发现和疾病理解[7][8] - **关键突破**:AlphaFold系统能在几秒内高精度预测蛋白质结构,速度远超传统需数天的算法[11] - **模式变革**:公司放弃了搭建按需预测服务器的传统思路,转而计算并免费开放所有已知蛋白质结构(约2亿个),供全球科学家使用[5][11][12] - **当前影响**:已有超过300万名科学家使用AlphaFold,几乎覆盖全球所有生物学家,预计未来几乎所有新药研发都会用到该工具[15] - **具体应用案例**: - **基础科学**:帮助解析了人体内最大的蛋白质复合体之一——核孔复合体的结构[16] - **农业与冷门研究**:帮助研究小麦等作物的科学家直接进入气候变化耐受性等核心问题,无需被蛋白质结晶步骤卡住[13] - **被忽视疾病**:为研究疟疾、查加斯病等影响数亿人口的疾病的研究者免费提供相关蛋白质结构,助其直接进入药物发现阶段[14] - **后续发展**:公司孵化了Isomorphic Labs,以AlphaFold为基础构建端到端药物发现系统,目前正在推进18到19个药物项目,涵盖心血管疾病、癌症和免疫学等领域[17][18] AI在生命科学链条的深化与拓展 - **药物发现流程优化**:AI系统可进行“虚拟筛选”,设计候选化合物并预测其与目标蛋白的结合强度,还能在几小时内检查该化合物与人体内其他约2万种蛋白质的潜在副作用,从而高效优化化合物特性[20] - **基因组解码**:AlphaGenome项目旨在解码占人类基因组98%的非编码区域,预测单点突变是否有害,未来有望与CRISPR等基因编辑技术结合,精准修复致病突变[22] - **效率提升**:通过计算机模拟(in silico)进行药物设计,可比传统湿实验室方法快几千倍甚至未来几百万倍地搜索化合物,仅需验证少数最有希望的结果[21] 从游戏到科学:AI的创造力与泛化能力 - **AlphaGo的里程碑**:2016年,AlphaGo击败围棋世界冠军李世石,其著名的“第37手”展现了AI超越人类经验的创造性,标志着现代AI时代的黎明[29][33] - **方法论演进**:与Deep Blue等依赖人类规则输入的“专家系统”不同,AlphaGo通过深度强化学习直接从经验中学习,具备泛化能力[30][32] - **系统泛化**:AlphaZero作为AlphaGo的进化版,移除所有人类知识,仅从游戏规则开始,通过自我对弈在17轮内从随机水平进化到超越世界冠军,其棋风新颖[34][35] - **现实问题应用**:AlphaGo/AlphaZero的范式可泛化至解决现实世界的复杂优化问题: - **算法优化**:AlphaTensor发现了更高效的矩阵乘法算法,即使提升几个百分点,也能在耗资数百亿美元的模型训练中节约巨大成本[38] - **芯片设计**:AlphaChip在元件布局和走线等NP-hard问题上,有时已超越人类设计师[38] - **材料科学**:该范式有助于设计具有特殊性质的全新材料[37] AI发展的路径、风险与未来展望 - **技术发展路径的转变**:Transformer等架构的突破使语言等能力比预期更早实现,ChatGPT的出现促使AI技术提前大规模推向公众,改变了原先更谨慎、实验室优先的推进节奏[26][28] - **提前部署的利弊**: - **益处**:加速技术进展;让公众能亲身体验前沿AI,促进社会适应;通过数百万人真实使用发现系统问题,有助于构建更鲁棒的系统[27][28] - **挑战**:并非最初理想的、更哲学审慎的推进方式[28] - **主要风险关切**: - **第一类风险(滥用)**:担心有人将用于科学和医学的技术转而用于作恶[5][40] - **第二类风险(失控)**:随着AI能力增强,尤其是进入“智能体时代”后,系统可能偏离轨道或突破安全护栏,这是未来2-4年需关注的重要技术挑战[40][41] - **风险对比**:认为深度造假等虚假信息问题是更短期、规模较小的担忧,而上述两类系统性风险是当前关注不足的更大问题[42][43] - **AGI愿景与未来图景**:目标是构建安全的AGI,并用以攻克一系列“根节点问题”(如核聚变、室温超导),从而根本性解决能源问题,并开启太空探索、疾病治愈的人类繁荣新时代[50][51] - **对人类特殊性的思考**:AI的发展过程本身可作为理解人类心智的“对照实验”,对于意识等终极问题保持开放态度,并将AI视为探索现实本质的工具[44][45][47]