人工智能驱动科学研究(AI4S)
搜索文档
翁红明:以AI4S赋能凝聚态物质科学发展
科技日报· 2026-01-15 11:36
文章核心观点 - 人工智能驱动科学研究(AI4S)是推动高水平科技自立自强和重构科研范式的核心引擎,在凝聚态物质科学领域深度推进AI4S对突破关键核心技术瓶颈和培育新质生产力至关重要 [1] - 当前凝聚态物质科学领域发展AI4S面临数据、技术与创新生态三大层面的挑战,需从构建国家级数据基座、强化数据基础能力、营造开放数据生态、构建创新联合体等多方面着力,以增强自主创新能力和国际竞争力 [2][6][7] AI4S在凝聚态物质科学领域的价值与范式转变 - AI4S推动科研从依赖研究者经验与直觉的“人力密集型”经验试错,转向“数据与智能密集型”的理性设计与预测 [2] - 这一范式转变能大幅提升研发效率、缩短从基础研究到产业应用的周期,并有望通过解析高维复杂关联催生新的科学发现与理论体系 [2] 发展AI4S面临的主要挑战 - **数据层面挑战**:凝聚态物质科学是典型的“小数据、大科学”,存在高质量数据资源匮乏、数据孤岛化严重、数据量不足、标准不一、缺乏有效汇聚机制和工具等问题,难以形成适合AI训练的优质数据集 [2][3] - **技术层面挑战**:数据采集与处理自动化程度较低,研究人员需花费大量时间在数据收集、清洗、整理等重复劳动上,流程缺乏系统化与智能化,严重制约科研效率 [4] - **创新生态层面挑战**:数据基础设施、存储算力、标准协议、共享机制、协同机制等基础支撑不足,导致数据流通不畅、协作效率低,跨团队协同创新能力有待加强 [5] 当前进展与技术路径 - **数据汇聚与融合**:通过构建数据平台整合数据,技术路径包括打通从大科学装置到数据平台的自动采集通道,以及对多源异构数据进行汇聚、治理、标注与标准化,以构建跨学科、高质量的“AI-Ready”数据体系 [3] - **数据治理技术应用**:开发高效的数据处理算法与工具,数据智能应用已在多个科学进展中发挥作用,如在月壤中首次发现含分子水的新矿物、实现十万量级新拓扑绝缘体的高效筛选、高温超导材料磁通钉扎智能设计与实验验证等 [4] - **创新生态初步实践**:已初步建立覆盖“数据—评测—应用”全流程的标准化体系,例如覆盖晶体材料拓扑分类、XRD智能结构解析等模型的标准化评测体系,以支撑规模化、协同化的数据驱动科技创新 [5] 全球战略布局与中国实践 - **全球战略**:美国“创世纪计划”、英国“国家AI战略”等国家级战略均将凝聚态物质科学与AI的深度融合置于核心位置,旨在通过建立大规模高质量数据库并与生成式AI融合来变革研发范式,抢占关键领域科技制高点 [6] - **中国实践**:以中国科学院凝聚态物质科学数据中心为例,通过前期部署系统推进实验、理论和计算数据全链路的研发与整合,已在软硬件平台、高质量数据集、数据标准、智能应用与生态共享等方面取得系统性进展 [6] 未来发展建议与着力点 - **构建国家级数据基座**:推进数据链前后端协同建设,前端建设科学数据工厂以提升标准统一的高质量科学数据产出效率,后端建设自主实验室以加快数据赋能材料创新的场景探索和实际落地 [6] - **强化科学数据基础能力**:重点强化数据采集、治理、应用和共享服务,增强数据平台与实验设备的结合,开发智能化数据采集工具,探索“计算—实验”迭代优化模式,以支撑前沿科技创新与重大成果产出 [7] - **营造开放协同的数据生态**:通过降低数据使用门槛、明确权属收益机制、强化培训服务,将“不敢、不会、不愿、不便”转化为“敢用、会用、愿享、便取”的新格局 [7] - **构建“产学研用”创新联合体**:完善从数据源头到应用市场的全链条数据生态,推动科学数据应用的市场化运作,前瞻布局数据产品、智能软件、解决方案等多元化服务模式,为科学数据平台长期自主运营与价值创造奠定基础 [7]