瞭望 | AI4S重塑科研未来
新华社·2025-12-08 17:05

AI驱动科学研究(AI4S)的核心进展与影响 - DeepSeek发布最新数学模型DeepSeekMath-V2,通过自验证方式突破AI在深度推理方面的局限,展现了强大的定理推理能力,让大模型在数学领域不再只是“做题家”,而可能依靠全面、严谨的数学推理能力对科学研究产生深远影响[1] - AI4S(人工智能驱动科学研究)概念旨在通过AI实现跨学科融合,加速突破,当传统物理模型在极端复杂系统前束手无策时,数据驱动范式可以跳过对微观机制的繁琐推演,利用算法直接从海量数据中寻找规律、构建“隐性”模型[1] - 该模式已在多个领域催生重大突破并实现科研效率的指数级提升,例如AlphaFold2将蛋白质结构预测周期从数十年缩短至数天,在材料科学领域缩短新材料设计周期,在环境科学领域为森林火灾预防等提供更准更快的解决方案[2] 全球及中国AI4S战略布局 - 多国加速布局发展AI4S,美国在2024年通过行政令、政策文件等系统性提升其战略地位,欧盟自2022年起布局,2025年发布“人工智能大陆行动计划”并建设AI-on-Demand在线服务平台[2] - 中国从国家到地方层面高度重视AI4S发展,2023年科技部会同国家自然科学基金委启动专项部署,2024年8月国务院印发《关于深入实施“人工智能+”行动的意见》,将“人工智能+”科学技术列为第一项重点行动[3] - 地方层面,2024年7月上海和北京均出台了支持AI4S发展的专项计划,推出了科学智能“百团百项”工程和《加快人工智能赋能科学研究高质量发展行动计划(2025—2027年)》等举措[3] AI4S对传统科研范式的变革 - AI4S带来了科学研究的另一种可能,即从海量数据中寻找规律,挑战了传统“自上而下”的经典科学范式,AI4S的目标是“实现预测”优先,与传统“理解因果”优先的标准存在根本差异[5][6] - 科研基础设施的根基从传统的精密仪器,转向了以大型计算中心、专用算法库和高质量数据库为核心的新型基础设施,源于其对海量数据和强大算力的根本依赖[6] - 科学家的核心任务从“如何操作”转变为“如何定义问题、评估结果和引导方向”,与生成式AI和强化学习模型形成“人机混合智能”协同探索模式,科研组织方式也从传统的“小作坊”模式向跨学科、平台化的大团队协作转型[7] AI4S发展面临的主要阻碍 - 高质量AI-Ready的科学数据稀缺是核心挑战,获取成本高昂,例如生命科学领域单一类别蛋白质结构实验数据采集成本超过8万元,训练AI模型通常需要百万量级样本[8][9] - 数据标注环节存在突出瓶颈,高度依赖专业人力,例如国内某机构曾组织20名博士全职工作6个月才完成1万张冷冻电镜图像标注,在效率和规模上难以满足AI训练需求[9] - 数据共享存在制约,科研数据分散形成“数据孤岛”,数据所有权、知识产权及竞争关系阻碍开放共享,例如生命健康领域医疗数据因隐私保护限制科研可用率较低[9] 产业化应用瓶颈与人才短缺 - AI科学发现能力指数级增长与人类实验验证及产业化应用能力线性爬坡之间存在巨大鸿沟,导致海量AI预测成果淤积在实验室无法转化,存在“AI一天的预测成果,人类需要十年验证”的现象[10][11] - 造成“堰塞湖”现象的主要原因包括标准缺失、验证瓶颈(自动化实验能力不足)以及政策约束(伦理审查严、审批周期长、投资风险高)[11] - 复合型人才短缺是核心挑战,高盛预测到2030年中国人工智能产业人才缺口将超过500万,麦肯锡报告预测到2030年中国AI人才供应仅为市场需求的1/3,且人才缺口体现在数量和质量两方面[11][12] 构建新型科研生态的路径 - 需构建面向人工智能时代的新型科研生态,包括培养复合型人才、推动数据开放共享、建立适应人机协同的科研评价与伦理治理体系[13] - 在人才培养上,需转变传统“专门人才”模式,构建复合型人才培养体系,例如北京大学深圳研究生院设立科学智能学院并推行由科学导师与AI导师共同指导学生的“双导师制”[13][14] - 在平台建设上,需从传统的“作坊模式”向整合多元主体的“平台模式”转变,培育AI4S创新联合体,促进多学科协作,例如中国科学院建立ScienceOne智能科研平台,北京科学智能研究院研发“玻尔科研空间站”AI科研平台[14][15] - 需加速推进AI4S关键领域“科研数据可信空间”建设,促进高质量科学数据和合成数据资源的集中,加强标准化建设,创新数据资源共享的技术和制度[16] - 需强化AI4S的科技伦理治理研究,应对算法不透明性、歧视、数据隐私及结果不可解释性等挑战,建立健全社会共治体系和机制[17]

瞭望 | AI4S重塑科研未来 - Reportify