Workflow
AlphaFold2
icon
搜索文档
计算机行业深度研究报告AI制药:从概念验证到商业化兑现
华创证券· 2026-04-10 17:35
证券分析师:吴鸣远 邮箱:wumingyuan@hcyjs.com 执业编号:S0360523040001 联系人:杨玖祎 证 券 研 究 报 告 计算机行业深度研究报告 AI 制药:从概念验证到商业化兑现 行业研究 计算机 2026 年 4 月 10 日 推荐(维持) 华创证券研究所 邮箱:yangjiuyi@hcyjs.com 行业基本数据 | | | 占比% | | --- | --- | --- | | 股票家数(只) | 337 | 0.04 | | 总市值(亿元) | 54,725.03 | 4.44 | | 流通市值(亿元) | 49,328.18 | 4.99 | 相对指数表现 | % | 1M | 6M | 12M | | --- | --- | --- | --- | | 绝对表现 | -13.9% | -12.6% | 10.0% | | 相对表现 | -9.2% | -9.4% | -4.7% | -14% 3% 21% 38% 25/03 25/06 25/08 25/11 26/01 26/03 2025-03-31~2026-03-30 计算机 沪深300 相关研究报告 《计算机 ...
AI预测蛋白结构新突破:崔振团队开发TDFold,性能更优、速度更快,资源消耗更低
生物世界· 2026-04-09 12:15
文章核心观点 - 北京师范大学研究团队提出名为TDFold的新方法,实现了从单序列进行高精度、高效率的蛋白质结构预测,其性能、速度和资源消耗均显著优于现有主流方法,有望大幅降低该领域的计算门槛并加速相关研究[3][4][5] 技术背景与现有方法局限 - AlphaFold2虽掀起革命并获诺贝尔奖认可,但其关键限制在于需要大量同源序列信息作为输入,导致计算成本高[2][3] - 现有顶级预测模型主要分两类:依赖同源信息的模型(如AlphaFold2/3、RoseTTAFold)和蛋白质语言模型(如ESMFold、OmegaFold)[10][11] - 依赖同源序列的方法计算成本巨大:预测一个500氨基酸的蛋白质,AlphaFold2需近1000秒,占用12GB GPU,且对缺乏同源序列的“孤儿蛋白”性能大幅下降[10] - 蛋白质语言模型虽摆脱同源序列依赖,但模型庞大复杂:ESMFold预测同样蛋白质需约100秒,占用20GB GPU[10] TDFold方法的核心创新 - 提出名为TDFold的二维几何模板扩散方法,用于生成高质量的成对几何特征(距离和方向),以实现精准高效的三维结构预测[4] - 工作流程分为两步:1) 二维几何模板生成:将蛋白质序列作为“文本提示”,通过改进的扩散模型生成几何蓝图,类似文生图技术;2) 序列-几何协同学习:使用轻量级图神经网络学习特征并预测三维原子坐标[14] - 采用LoRA微调技术,仅训练少量参数使Stable Diffusion模型适应蛋白质几何生成任务,大幅降低训练成本[14] TDFold的性能优势 - **预测性能更优**:在孤儿蛋白数据集Orphan上TM-score达0.46,优于ESMFold的0.42和AlphaFold2(全模式)的0.37;在Orphan25数据集上TM-score达0.61,明显高于ESMFold的0.54[20] - **在CASP基准测试中表现提升**:与ESMFold相比,在CASP14、15、16上TM-score分别提升0.02、0.01、0.02;与OmegaFold相比,在CASP15和CASP16上TM-score分别显著提升0.07和0.08[20] - **推理效率极高**:预测500个氨基酸的蛋白质仅需约10秒,速度比ESMFold快10倍,比AlphaFold2/3和RoseTTAFold快10-100倍[3][20] - **资源消耗显著降低**:GPU占用仅需约7GB,低于AlphaFold2的12GB、RoseTTAFold的16GB和ESMFold的20GB[3][20] - **训练成本低**:使用单张英伟达4090 GPU,一周内即可完成训练[20] 研究的实际意义与行业影响 - 大幅降低蛋白质结构预测门槛,使资源有限的高校和科研机构能使用消费级GPU在短时间内完成高质量预测,无需昂贵计算集群[5][18] - 为生物医学研究带来多重加速可能:快速解析新发现蛋白质结构以加速药物靶点识别、实时跟踪病毒蛋白变异以支持疫苗设计、大规模扫描蛋白质数据库以发现新功能模块[21] - 技术展示了跨领域融合的威力,将计算机视觉中的扩散模型创新性应用于结构生物学问题[19] - 预示未来发展趋势:在线预测服务响应时间可能从分钟级降至秒级、个人电脑也能运行高精度预测工具、实时动态的蛋白质折叠过程模拟成为可能[22][23]
Nature子刊:李洪林/张凯/张捷团队开发AI模型Mac-Diff,生成蛋白质动态构象
生物世界· 2026-03-04 12:37
研究背景与意义 - AI模型如AlphaFold2已能根据氨基酸序列预测蛋白质的单一稳定结构,但蛋白质在细胞内是动态变化的,其在不同构象状态间的转换对功能至关重要[2] - 全面捕捉蛋白质的构象全貌及其动态灵活性,对理解其功能仍是一大挑战[2] 研究成果发布 - 2026年2月25日,由华东理工大学、华东师范大学、复旦大学的研究团队合作在《自然-机器智能》期刊上发表了一项关于生成多样化蛋白质构象集合的研究[3] 核心模型:Mac-Diff - 研究开发了一个名为“模态对齐条件扩散模型”(Mac-Diff)的AI模型,用于生成未知蛋白质的构象集合[4] - Mac-Diff的核心创新是“局部感知模态对齐注意力”机制,该机制在蛋白质的氨基酸序列(条件视图)和三维结构(目标视图)之间建立精细的物理对应关系[8] - 模型利用来自ESM-2等蛋白质语言模型的语义丰富序列嵌入作为条件输入,这些嵌入能捕捉从进化模式、结构基序到功能特性的广泛信息[10] - Mac-Diff的架构基于分数扩散模型,采用U-Net结构,包含整合时间步嵌入和残基对表示的ResNet块,以及通过自注意力和LAMA-attention更新表示的Transformer块[10] 模型性能表现 - 在恢复快速折叠蛋白质的构象分布任务中,Mac-Diff在关键指标上优于现有扩散和流基模型:成对Cα原子距离分布的Jensen-Shannon散度降低了约18%,回转半径分布降低了22%,基于TICA的JS散度降低了5%[13] - Mac-Diff在生成的构象结构准确性和多样性之间取得了良好平衡,在12个测试蛋白质中的平均得分最高[13] - 该模型成功恢复了牛胰蛋白酶抑制剂(BPTI)仅在1毫秒长时分子动力学模拟中观测到的重要构象亚状态,并预测了腺苷酸激酶(AdK)的闭合与开放状态[15] - 在效率方面,Mac-Diff的采样速度比传统分子动力学模拟快约3000倍(超过三个数量级)[16] 应用与影响 - Mac-Diff标志着蛋白质结构预测从静态向动态的重要转变,有助于更好地理解蛋白质折叠动力学及序列、结构、功能间的复杂关系[18] - 模型预测构象异质性的能力将在基于结构的药物设计和蛋白质工程中发挥重要作用,有助于设计更有效的药物和开发具有新功能的蛋白质[18] - 该技术为增进蛋白质动力学和结构变异性认知提供了重要工具,对结构生物学、基于结构的药物设计及蛋白质工程具有广泛影响[4]
当人工智能走向实体空间
新浪财经· 2026-02-02 04:19
文章核心观点 - 人工智能的发展是由先进计算技术驱动的一场革命,正从数字世界走向物理世界,并与制造业深度融合,成为赋能千行百业、重塑社会的颠覆性力量 [1][4] - 当前人工智能发展正处于从以生成式AI为基础的通用人工智能阶段,迈向基于感知与交互的机器自主进化的超级人工智能阶段 [4] - “实体系人工智能”是连接信息世界与物理世界的桥梁,是推动“人工智能+制造业”从概念走向落地的关键环节,但其发展仍面临技术壁垒高、实施路径不清晰等挑战 [8][10] - 通过技术攻关、应用示范、标准引领三位一体的协同联动,可以加速实体系人工智能发展,为深入实施“人工智能+”行动注入动力 [12] 人工智能技术演进与现状 - 人工智能的发展历经了符号主义、连接主义、行为主义等多条技术路线的并行探索,如今多技术路线融合统一成为发展趋势 [9] - 技术演进的关键节点包括:2012年卷积神经网络CNN大幅提升图像识别效果;2016年AlphaGo击败世界围棋冠军;2017年Transformer架构为BERT、GPT等大模型奠基;2020年OpenAI发布包含1750亿参数的GPT-3模型;2024年Deepseek以低成本、高效能开源特性打破垄断,以及Sora模型在视频生成领域取得重大突破 [3][4] - 目前人工智能在图像分类、自然语言推理、视觉问答、英文理解等方面已超过人类平均水平,并在多任务语言理解和数学竞赛方面展现出超过人类平均水平的潜力 [4] - 人工智能是数学、神经科学、认知科学、计算机科学等多学科交叉融合的产物,并反过来催生了如生物信息学等新兴学科,例如AlphaFold2解决了蛋白质折叠问题,GNoME工具预测并合成了超过41种新材料 [5][6] 人工智能与制造业的融合应用 - 制造业是人工智能赋能的重点领域,“人工智能+制造业”是提升传统产业、培育新兴产业和未来产业的重要举措 [7] - 根据IDC数据,中国工业企业应用大模型及智能体的比例从2024年的9.6%大幅提升至2025年的47.5% [7] - 中国在智能制造方面成效显著:已培育421家国家级智能制造示范工厂,其中90%以上应用了人工智能、数字孪生等技术;累计建成7000余家先进级、500余家卓越级智能工厂,并遴选出15家领航级智能工厂培育对象 [7] - 2025年8月,国务院印发《关于深入实施“人工智能+”行动的意见》,明确推动工业全要素智能联动,加快人工智能在设计、中试、生产、服务、运营全环节落地应用 [8] 实体系人工智能的发展与挑战 - 实体系人工智能通过“感知—认知—决策—执行”体系架构,使机器能够自主地“融入”并“改造”物理世界 [8] - 技术条件的成熟为人工智能进入实体空间提供了支撑:传感器技术实现精准感知;机器人技术实现感知与执行一体化;AI芯片性能飞跃支撑大规模模型训练与推理;大模型发展实现了跨模态的理解与生成 [9] - 行业应用的需求是核心动力,例如实现生产线柔性重构、复杂产品精密装配、设备预测性维护、能耗动态优化等,要求AI系统能直接感知设备状态、实时分析数据并精准控制执行机构 [9] - 实体系人工智能发展面临技术壁垒高、实施路径不清晰、规模化发展难度大等多重挑战 [10] 推动实体系人工智能发展的路径 - **技术攻关**:需构建“感知—认知—决策—执行”技术体系,包括建立精准表征物理世界的信息空间、构建大小模型协同的决策体系(利用大模型“通才”能力进行顶层规划,小模型“专才”能力执行具体任务)、建立分层与端到端结合的推理控制架构 [11] - **应用示范**:需建立“场景开放+政策激励”双轮驱动模式,通过央地联合组织重大应用示范打造标杆场景,并通过“智能工厂梯度培育行动”及财政补贴或税收优惠鼓励企业参与,加速全链条发展 [11][12] - **标准引领**:需构建统一的体系架构与评估、规范的技术方法与测评、通用的系统应用定义与要求等标准体系,以实现行业模型的“纵向专用”和系统集成的“横向通用”,为规模化发展提供支撑 [12] - 总体应坚持“以数据为牵引、以模型为核心、以平台为支撑”的发展路线,通过技术、应用、标准三位一体协同联动加速发展 [12]
登上Nature封面:谷歌DeepMind推出DNA模型AlphaGenome,全面理解人类基因组,精准预测基因突变效应
生物世界· 2026-01-29 12:28
文章核心观点 - DeepMind推出新型AI工具AlphaGenome,这是一个能够处理长达100万碱基对序列的统一DNA序列模型,可高精度预测广泛的基因组特征和突变效应,标志着基因组AI模型从“单项专家”向“通用翻译官”的重要转变 [2][26] - AlphaGenome在技术上有三大突破:兼顾长序列分析与单碱基分辨率、统一处理多任务、高效评估突变影响,其性能在绝大多数任务中超越了现有的专用模型 [10][11][12][13][19] - 该工具在解析非编码区域、探究疾病机制、研究罕见遗传病及指导合成生物学设计等方面展现出强大的实际应用价值,有望推动对基因组的基本理解和新疗法的开发 [2][3][22][24][26] 基因组解读的挑战与背景 - 人类基因组中约98%为非编码序列,其功能至今仍是生物学最大的谜团之一,解读DNA序列的细微变化如何影响生物体是巨大挑战 [7] - 过去十年开发的许多AI模型仅专注于单一任务,科学界越来越需要能够“All in One”解读DNA序列的工具 [8] AlphaGenome的技术突破 - **兼顾“远景”与“近景”**:通过创新算法架构,首次实现在100万个碱基对长度上保持单碱基分辨率的分析能力 [11] - **多任务统一处理**:可同时预测数千种分子特性,如基因起止位置、RNA剪接位点、DNA可及性、蛋白质结合位点等,一个模型即可全面解析 [12] - **高效的突变影响评估**:能在一秒钟内评估基因突变对所有分子特性的影响,快速识别可能导致疾病的遗传变异 [13] 模型架构与技术核心 - 架构巧妙结合了卷积神经网络与Transformer模块,前者识别DNA序列中的局部模式,后者建立长距离联系以理解全局语境,实现了“既见树木,又见森林” [15][16] 性能表现 - 在24项DNA序列功能预测任务中,AlphaGenome在22项中实现了最先进性能(SOTA) [19] - 在26项遗传变异影响预测任务中,AlphaGenome在24项中实现了最先进性能(SOTA) [19] - 作为一个“通用模型”,其表现超越了多数为特定任务优化的“专用模型”,打破了传统认知 [19] 实际应用与价值 - **疾病机制解析**:成功用于探究T细胞急性淋巴细胞白血病(T-ALL)中非编码突变通过引入MYB DNA结合基序激活致癌基因TAL1的潜在机制 [22] - **罕见遗传病研究**:能够直接从DNA序列预测RNA剪接位点,为理解由剪接错误引起的疾病(如脊髓性肌萎缩症)提供新工具 [24] - **合成生物学设计**:其预测能力可用于指导设计具有特定调控功能的合成DNA序列,例如组织特异性基因开关,为精准基因治疗奠定基础 [24] 行业意义与未来展望 - 结合AlphaFold和AlphaMissense等成果,科学界正在构建一个前所未有的“基因组集成开发环境”,代表生物学研究从描述性科学转向预测性科学的根本转变 [26] - AlphaGenome是理解和编辑生命代码的强大解码器,为分析调控基因组提供了强大且统一的模型,提升了从DNA序列预测分子功能和突变效应的能力 [26]
诺奖得主David Baker最新论文:AI设计蛋白新突破,精准设计蛋白结合剂,克服“不可成药”靶点
生物世界· 2026-01-27 16:00
行业技术突破 - 诺奖得主David Baker团队的最新研究展示了一项重要突破:利用条件性RFdiffusion模型设计能够高亲和力结合亲水性蛋白质靶点的结合蛋白 [4] - 该技术的设计策略是通过条件性RFdiffusion生成与靶蛋白边缘β链形成几何匹配的扩展β片层结构,并特别设计氢键基团来互补靶蛋白上的极性基团 [5][6] - 实验验证表明,该技术针对KIT、PDGFRɑ等多个重要蛋白靶点设计了蛋白结合剂,获得了皮摩尔到纳摩尔级的高亲和力,且表现出高度特异性,KIT复合物晶体结构与设计模型高度一致 [9] - 此项技术突破了传统计算蛋白质设计的局限,显著扩展了可设计蛋白结合剂的靶标范围,特别是解决了针对亲水性相互作用表面的挑战,对于药物开发和蛋白质功能研究具有重要价值 [7] 培训课程概览 - 文章主体内容为推广一系列与AI蛋白质设计、合成生物学及计算机辅助药物设计相关的线上培训课程,宣称AI蛋白质设计是2026年最受关注的技术 [7] - 课程主办方宣称已联合清华大学、北京大学、西湖大学、浙江大学、中国科学技术大学、天津大学、协和药物研究所、上海药物研究所举办培训六十七期,参会学员达**7000余人**,学员好评极高,其中不乏论文发表于Nature、Cell、Science等国际顶刊 [7] - 主要开设六大课程:AI蛋白质设计线上直播课、AI抗菌肽设计线上直播课、合成生物学与基因线路设计线上直播课、CADD计算机辅助药物设计线上直播课、AIDD人工智能药物发现与设计系统培训录播课、AIDD人工智能药物发现与设计进阶顶刊复现录播课 [8] AI蛋白质设计课程内容 - 该课程旨在教授2026年最新最前沿的蛋白质设计工具及流程,让学员快速掌握David Baker的核心方法 [12] - 培训内容涵盖蛋白质结构预测(实操AlphaFold2、AlphaFold3、pymol、Foldseek)、蛋白质大语言模型(实操ESM系列、ProGen)以及多种蛋白质设计方法(实操ProteinMPNN、LigandMPNN、Rfdiffusion、RFdiffusion3等) [12] - 课程为期六天,理论结合实操,提供服务器使用,并讲解十二篇Nature/Science/Cell/JACS顶刊文献,以让学员了解当下蛋白质设计的核心热点与优势 [12] - 详细课程大纲分为六个部分,包括:蛋白质相关的深度学习简介、深度学习与蛋白质结构预测、固定主链蛋白质序列设计、深度学习蛋白质结构设计、面向功能的蛋白质序列设计、基于深度学习的蛋白质挖掘与改造应用 [12][16][21][24][28][32] AI抗菌肽设计课程内容 - 该课程聚焦于利用生成式人工智能设计抗菌肽,以应对抗生素耐药性挑战 [35] - 课程将精讲并复现基于蛋白质语言模型嵌入的潜在扩散模型——AMP-Diffusion,该模型由宾夕法尼亚大学和杜克大学研究人员合作开发,能够通过探索序列空间快速发现具有广谱抗菌活性(包括对多重耐药菌株)且低细胞毒性的候选抗菌肽 [35] - 课程内容分为五个部分,涵盖:基础环境与抗菌肽入门、Python编程基础与AMP-Diffusion架构解读、AMP-Diffusion模型实践与序列生成、计算筛选排序与设计验证、AMP-Diffusion论文精解与实战复现 [37][41][47][50][53] 合成生物学与基因线路设计课程内容 - 该课程旨在帮助学员建立将基因线路设计应用于解决真实科研与产业问题的能力,讲师具备横跨原核生物、真核模型到哺乳动物细胞系统的广谱跨物种实战经验 [57] - 课程设计分为五个核心部分,引导学员完成从工程思维建立、工具使用、诊断调优到智能设计与计算驱动设计的完整学习路径 [58][70][91][100][112] - 课程包含大量实操案例,如“番茄红素工程菌设计”、“动态基因线路(Toggle Switch)构建与模拟”、“利用无细胞系统进行通路快速优化”以及“使用计算工具(如FBA、ODE建模)预测和优化细胞行为” [63][87][107][113][120] CADD计算机辅助药物设计课程内容 - 该课程旨在系统讲解计算机辅助药物设计的核心原理与操作流程,涵盖从分子建模、虚拟筛选到分子动力学模拟的完整技术体系 [129][130] - 课程分为六个部分,内容包括:pymol使用与一般蛋白-配体分子对接、虚拟筛选、多类型分子对接(蛋白-蛋白、蛋白-金属离子、蛋白-DNA/RNA)、蛋白-蛋白相互作用预测、Linux下的分子动力学模拟、以及CADD驱动的抗体与酶工程设计实战 [131][138][147][156][158][163] AIDD人工智能药物发现课程内容 - 该系列包含系统培训录播课和进阶顶刊复现录播课,目标是让学员掌握人工智能在药物发现中的应用,具备AIDD模型构建和数据分析能力 [170][171] - 系统培训课程内容涵盖AIDD概述、环境搭建、RDKit工具包使用、药物数据库获取、以及深度学习(神经网络、图神经网络、Transformer)在药物设计中的基本原理与应用 [174] - 进阶顶刊复现课程则侧重于深度学习在化学反应预测、分子生成(如使用扩散模型、NLP)、以及将AI方法应用于真实药物研发场景(如酶工程、高亲和力小分子筛选)的案例分析与复现 [172][173] 讲师背景 - AI蛋白质设计课程主讲老师来自国内超顶尖课题组,在学术界和工业界均有丰富算法开发应用经验,主要从事蛋白质结构预测和设计研究,相关工作成果已在PNAS、Angew. Chem. Int. Ed.、Nature、Science等期刊发表,其课题组已发表文献**300余篇** [177] - AI抗菌肽设计课程主讲老师来自南开大学院士课题组,从事AI抗菌肽设计和蛋白质设计研究,成果发表于New England、Plos one等期刊 [178] - 合成生物学课程主讲老师为拥有海外背景的合成生物学专家,拥有6年基因线路设计经验,曾于中科院合成生物学重点实验室工作,目前致力于工业界代谢工程应用 [179] - CADD课程主讲老师来自江南大学,具备大量CADD及分子模拟项目经验,熟练掌握AutoDock Vina、Schrödinger、GROMACS、AlphaFold3、RFdiffusion等工具 [180] - AIDD课程主讲老师来自天津大学,拥有十余年计算机算法研究和程序设计经验,研究方向涉及深度学习药物发现和药物合成路径设计,发表SCI高水平论文**10篇** [181] 课程安排与费用 - 各直播课程授课时间集中在2026年1月至2月,通过腾讯会议线上直播,采用理论+实操模式 [183] - 课程费用根据公费或自费有所不同:AI蛋白质设计直播课公费价**6880元**/人,自费价**6380元**/人;其他直播课(AI抗菌肽设计、CADD、合成生物学)公费价**6380元**/人,自费价**5880元**/人 [184] - 录播课程(AIDD系统培训与进阶顶刊复现)公费价**4980元**/人,自费价**4680元**/人 [185] - 推出多项优惠:报二送一、提前报名缴费可享**800元**优惠(限前15名)、报名直播课赠送往期课程回放等 [8][185]
Science发布2025十大科学突破 | 红杉爱科学
红杉汇· 2025-12-29 08:05
势不可挡的可新再生能源 - 全球可再生能源以太阳能和风能为主快速增长,其新增发电量已覆盖2025年上半年全球新增用电,并在总量上超过化石能源 [4] - 中国是推动这一转型的关键力量,通过大规模发展太阳能电池板、风力发电机和锂电池储能系统,巩固了全球领先地位 [4] - 依托中国低成本制造,小型屋顶光伏系统在全球快速普及,为欧洲、南亚等全球的数百万家庭提供可靠、经济的能源保障 [4] 定制化基因编辑为极罕见疾病带来新希望 - 研究团队为一名患有严重氨甲酰磷酸合成酶-1缺乏症的新生儿定制了脂质纳米颗粒递送的碱基编辑疗法,该疾病在新生儿中发病率为130万分之一 [5] - 整个定制化疗法开发过程仅花费了六个月时间,患儿在六个月大时接受了治疗 [5] 对抗性传播疾病的新武器 - 2025年,两款针对淋病的新药gepotidacin和zoliflodacin的3期临床试验结果发表,淋病每年影响数千万人 [8] - 这两种新型抗生素类药物已获得美国FDA批准上市,是近几十年来获批的对抗淋病传播的新武器,且均为口服形式,比目前常用的注射用头孢菌素抗生素更方便 [8] 神经元对癌症的致命馈赠 - 研究发现神经元与癌细胞之间会建立隧道纳米管,将自身的线粒体捐赠给癌细胞,增强了癌细胞转移过程中穿越血管时抵御压力的能力 [10] - 这项研究揭示了癌症转移中的一种新的生物学信号轴——神经-癌细胞线粒体通道,为治疗创新提供了新的靶点 [10] 天空中的全视之眼 - 维拉·鲁宾天文台在智利落成,其革命性工作模式为每3天一次对整个可见天空进行无间断扫描,持续10年 [12] - 该天文台将收集比历史上所有光学望远镜总和还要多的数据,构建最详尽的宇宙3D地图,每晚将产生数百万个天体变化警报 [12] - 其配备的相机能瞬间生成3200兆像素图像,视场能覆盖45个满月大小 [12] 揭开龙人头骨之谜 - 研究首次成功从发现于1933年的龙人头骨的牙结石中获取到古老型人类古DNA [15] - 这是自丹尼索瓦人发现15年以来,首次用遗传学证据将较完整的头骨形态与丹尼索瓦人关联起来 [15] - 从牙结石中成功提取宿主古DNA,为人类遗传学研究开创了新途径 [15] 大语言模型助力科学研究 - 在数学领域,DeepMind的Gemini模型在国际数学奥林匹克竞赛中获得金牌,OpenAI的GPT-5解决了困扰数学家数十年的组合数论和图论难题 [17] - 在化学领域,微调后的大语言模型仅用15次实验就为一种未知的复杂反应找到了最佳条件,省去了数百次耗时数周的实验 [17] - 在生命科学领域,AI科学家在2天内就发现了肝纤维化的潜在药物并复现了一项原本耗时数年才得出的科学发现 [17] 计算的突破助力揭示粒子物理新进展 - 理论家运用超级计算机和格点规范理论,将连续时空离散化为四维点阵,从而从头精确计算μ粒子磁性中夸克和胶子的贡献 [21][22] - 格点计算已达到与数据驱动方法相媲美的精度,新的理论预测值与Muon g-2实验最终测量值一致,标志着格点规范理论的成功 [22] 异种移植不断创造历史 - 一名美国男子移植了拥有69处基因修饰的猪肾脏后,该肾脏在他体内正常工作了近9个月,接近历史最长纪录 [23] - 一名中国女性患者移植了仅6处基因修饰的猪肾脏,也取得了相近的存活时间 [23] 耐高温水稻 - 研究发现了水稻中的一种天然基因开关系统,该主效基因位点QT12的天然变异和NF-Y复合体共同调节耐热性 [26] - QT12的低表达赋予了水稻更优的品质,并在大规模高温试验中使优质水稻产量提高1.31-1.93倍 [26]
Science发布2025十大科学突破,中国占据半壁江山——可再生能源、龙人头骨、异种器官移植、耐高温水稻
生物世界· 2025-12-19 12:08
中国可再生能源的迅猛发展 - 全球可再生能源发电量已超过煤炭,2025年1月至6月太阳能和风能的增长足以覆盖全球电力使用的全部增长[6] - 中国宣布将在十年内通过加倍发展风能和太阳能实现碳排放量减少多达10%[6] - 中国绿色能源转型规模巨大,2024年新增太阳能和风能发电量相当于约100座核电站的发电量,且2025年增速加快[6] - 中国正在建设数十条新的特高压输电线路,从西部沙漠向东部城市延伸数千公里以输送清洁能源[6] - 中国在打造自身绿色能源体系过程中,催生了一个价值近1800亿美元的出口产业,出口电动汽车、太阳能电池板和风力涡轮机等商品[8] - 非洲和南亚的太阳能电池板进口量大幅增长,因屋顶太阳能可廉价供电[6] - 该领域进展被《科学》杂志评为2025年度科学突破之首,并被《自然》期刊选为2025年振奋人心的七大科学突破之一[2][9] 定制化基因编辑疗法 - 研究团队为一名患有罕见遗传病(CPS1缺乏症,新生儿发病率130万分之一)的患儿定制了脂质纳米颗粒递送的碱基编辑疗法kayjayguran abengcemeran[14] - 整个疗法开发过程仅花费六个月时间,患儿在六个月大时接受治疗,经过307天住院后疾病似乎得到治愈[14] 对抗性传播疾病的新药 - 两款针对淋病的新药gepotidacin(GSK开发)和zoliflodacin(Innoviva开发)的3期临床试验结果于2025年发表,并获美国FDA批准上市[17] - 这是近几十年来获批的对抗淋病的新武器,两款新药均为口服形式,比常用的注射用头孢菌素抗生素更方便[17] 癌症转移机制的新发现 - 研究发现神经元与癌细胞之间会建立隧道纳米管,将自身的线粒体“捐赠”给癌细胞[20] - 这些被捐赠的线粒体增强了癌细胞在转移过程中穿越血管时抵御压力的能力,从而帮助其转移和扩散[20] - 该研究揭示了神经-癌细胞线粒体通道这一新信号轴,为治疗创新提供了新靶点[23] 鲁宾天文台与天文观测革命 - 鲁宾天文台将以每3天一次的频率,持续10年对整个可见天空进行无间断扫描,生成前所未有的详细图像[26] - 它将收集比历史上所有光学望远镜总和还要多的数据,构建最详尽的宇宙3D地图,每晚将产生数百万个天体变化警报[27] - 其相机能瞬间生成3200兆像素图像,视场覆盖45个满月大小[28] - 其数据将彻底改变多个天文学领域,包括太阳系研究、动态宇宙观测、星系演化研究,并帮助研究暗物质和暗能量[28] 古人类学与“龙人”头骨研究 - 研究团队首次成功从发现于1933年的“龙人”头骨牙结石中获取到古老型人类古DNA[33] - 这是自丹尼索瓦人发现15年以来,首次用遗传学证据将较完整的头骨形态与丹尼索瓦人关联起来[33] - 该研究为丹尼索瓦人研究提供了关键线索,并开创了从牙结石中提取宿主古DNA的新途径[33] 大语言模型在科学研究中的应用 - 大语言模型在2025年于多个科学领域展现出“博士级”专业能力[36] - 在数学领域,DeepMind的Gemini模型在国际数学奥林匹克竞赛中获得金牌,OpenAI的GPT-5解决了困扰数学家数十年的组合数论和图论难题[36] - 在化学领域,微调后的大语言模型仅用15次实验就为一种未知复杂反应找到了最佳条件,省去了数百次耗时数周的实验[36] - 在生命科学领域,AI科学家在2天内发现了肝纤维化的潜在药物并复现了一项原本耗时数年才得出的科学发现[36] - 这些突破引发了“AI for Science”的淘金热,科技巨头和投资者向相关初创公司投入了巨额资金[37] 粒子物理与计算物理学的突破 - 理论家运用超级计算机和格点规范理论,通过将连续时空离散化为四维点阵,从头精确计算了μ粒子磁性的关键贡献[41] - 2025年5月,理论预测值更新后与Muon g-2实验最终测量值一致,标志着格点规范理论的成功,尽管它同时抹去了一种新物理存在的可能线索[41] - 此前,美国Muon g-2实验曾暗示μ粒子的磁性比预测强约十亿分之四[40] 异种器官移植的进展 - 异种移植领域在2025年取得里程碑进展,移植器官存活时间被显著延长[44] - 一名美国男子移植了拥有69处基因修饰的猪肾脏后,该肾脏在其体内正常工作了近9个月,接近历史最长纪录[44] - 一名中国女性患者移植了仅6处基因修饰的猪肾脏,也取得了相近的存活时间[44] - 这些成功使异种移植向解决人类器官短缺问题的可行方案迈进了一大步[45] 耐高温水稻的基因研究 - 研究团队发现了水稻中的一个天然基因开关系统(涉及QT12位点和NF-Y复合体),赋予了其田间热耐受性[48][50] - QT12的低表达能赋予水稻更优的品质,并在大规模高温试验中使优质水稻产量提高1.31-1.93倍[50] - 该研究为水稻田间耐热性提供了机制见解,并提供了一个概念验证育种策略[50]
中国创新药 正从“快速追随者”迈向“首创创新者”
经济网· 2025-12-15 16:56
政策与行业战略方向 - 中国“十四五”规划明确支持创新药和医疗器械发展 [1] - 中国医药行业正从“快速追随者”向“首创创新者”稳步迈进 [1][4] - 政策、资本和人才积累正推动中国药企加速向源头创新转型 [5] 技术驱动与研发变革 - 基因编辑作为底层颠覆性技术,通过精准修改基因代码来治疗遗传性血液疾病、罕见病、癌症等多种疾病 [2] - 人工智能通过大数据分析和模型预测,正重塑创新药研发,大幅提升效率、成功率和降低成本 [3][4] - 2024年诺贝尔化学奖授予AlphaFold开发者,标志AI在基础科学的价值获顶级认可,将进一步推动其在生命科学领域的应用 [4][8] - AlphaFold2自2020年以来已预测约2亿个蛋白质结构,被全球190多个国家的数百万研究人员广泛应用 [8] 市场动态与模式转变 - 过去中国药企作为“快速追随者”,能在低风险下快速积累能力,但导致赛道扎堆和价格竞争,例如一款抗体药物可能短时间出现上百家跟随者 [4] - 创新药领域经历“资本寒冬”,市场对“追逐热点、快速跟随、靠价格竞争”商业逻辑的认可度下降 [4] - 创新药研发具有高风险、重投入、长周期特点,需要政策与资本提供科学、理性、长期的支持以构建健康生态 [5]
这才是 AI 近年来最有价值的成就,却被很多人忽视
36氪· 2025-12-01 08:15
行业背景与核心挑战 - 人体内最大的蛋白质肌联蛋白(titin)由超过3.4万个氨基酸组成,其化学全名长达189,819个字母,自1954年发现以来,其完整结构在70多年间一直未知,传统实验方法几乎无法解析[1] - 解析蛋白质三维结构的传统方法(如核磁共振、X射线晶体学、冷冻电镜)成本高昂,设备动辄上百万美元,耗时数月到数年,对于肌联蛋白这种拥有三百多个结构域的超级蛋白质更是难以应对[3] - 在浩瀚的蛋白质世界中,人类通过实验解析出的蛋白质结构不到20万个,在所有人体蛋白质中,也只有约35%的结构被实验解析,且很多残缺不全[6] 技术突破:AlphaFold的出现与能力 - 2020年11月30日,DeepMind推出的AlphaFold2在“全球蛋白质结构预测比赛”(CASP)中,凭借氨基酸序列预测蛋白质结构的准确率超过了90%,直逼实验方法[6] - AlphaFold数据库中的蛋白质预测结构已超过2亿个,涵盖了人类蛋白质组98.5%的结构,来自190多个国家的上百万科研人员正在使用这一开源工具[6] - 2024年,谷歌发布了AlphaFold3,能精准预测蛋白质与DNA、RNA等其他生命分子的相互作用,并推出了能主动设计定制蛋白质的AlphaProteo[23] - 2025年,谷歌推出了AlphaGenome,将预测能力延伸至DNA层面,可从DNA序列预测基因突变对生物学过程的影响[23] - 在蛋白质结构预测领域,除AlphaFold外,还有RoseTTAFold、ESMFold和I‑TASSER等AI模型也在不断突破[23] 应用领域:医药研发与疾病治疗 - 在2020年新冠疫情爆发初期,DeepMind利用开发中的AlphaFold2预测了新冠病毒部分蛋白质的结构,帮助研究者迅速了解病毒生理机制并筛选潜在治疗药物[8] - 生物技术公司Insilico Medicine将AlphaFold2整合进其AI药物发现平台Pharma.AI,通过该全流程AI方法,在几年内发现了治疗特发性肺纤维化的候选药物Rentosertib,该药物已进入II期临床试验,成为全球首个完全由AI发现靶点并设计化合物的试验药物[18][20] - 英国牛津大学的研究团队利用AlphaFold2找到了疟原虫蛋白质的关键结合位点,为开发能切断疟疾传播链的疫苗提供了新思路[10] - 马耳他大学的科学家使用AlphaFold研究基因突变对骨质疏松的影响,通过对比正常与突变蛋白质的结构模型来观察功能破坏的可能性[11] - 2023年,DeepMind基于AlphaFold推出了AlphaMissense模型,利用其对结构的“直觉”来判断错义突变是否可能致病,成功归类了人类所有错义突变中的89%,生成了“人类错义突变目录”,以帮助锁定罕见遗传病及糖尿病等复杂疾病的遗传因素[13] 应用领域:环境保护与工业设计 - AlphaFold2能帮助科学家重新设计蛋白质,以完成如高效降解一次性塑料等过去难以做到的任务[14] - 英国朴次茅斯大学的科学家利用AlphaFold,在短短几天内获得了上百种来自微生物的候选降解酶的三维结构,并基于这些结构设计反应更快、稳定性更高、成本更低的酶,以更有效地分解塑料垃圾[17] 具体案例:肌联蛋白研究的进展 - AlphaFold2将肌联蛋白的序列切分成166个“重叠群”(contig),每个长达上千个氨基酸,并分别给出了结构预测,科学家已将这些结构整合,得到了肌联蛋白中所有相互串联的双结构域的三维蓝图[21] - 科学家借助AlphaMissense等工具,评估了肌联蛋白不同突变的潜在致病性,使这个此前几乎无法触及的研究对象变得有迹可循[21] - 2024年,科学家发现了一种比肌联蛋白还要大25%的蛋白质PKZILLA-1,刷新了自然界已知最大蛋白质的纪录[23]