新材料研发提速,上交大团队开发新AI材料设计模型CGformer,融合全局注意力机制
36氪·2025-09-29 15:26

技术突破与模型创新 - 开发出全新AI材料设计模型CGformer,成功突破传统晶体图神经网络(如CGCNN、ALIGNN)仅关注局部原子交互的局限 [1][2] - 模型创新性地将Graphormer的全局注意力机制与CGCNN的晶体图表示方法融合,并集成中心性编码和空间编码,使其能捕捉长距离原子间的相互作用 [2][6][9] - 通过多头注意力模块使每个节点能“关注”晶体图中所有节点,而非仅相邻节点,实现了对复杂晶体结构全局信息的处理能力 [7][9] 模型性能优势 - 在预训练阶段,CGformer的10折交叉验证训练集平均绝对误差(MAE)为0.1703,较CGCNN性能提升25.7%;测试集平均MAE为0.3205,提升近10% [10] - 在针对高熵钠离子固态电解质(HE-NSEs)的研究中,CGformer的平均绝对误差较CGCNN降低了25% [4] - 在微调阶段,模型经过约10轮微调后MAE即显著下降,最终10折交叉验证平均MAE仅为0.0361,预测值与真实值偏差极小 [12] 实际应用成果 - 从148,995种可能的高熵结构中筛选出18种,成功合成并验证了6种高熵钠离子固态电解质(HE-NSEs) [4] - 实验合成的6种HE-NSEs材料在25℃室温下的钠离子电导率在0.093至0.256mS/cm之间,显著高于未掺杂的Na₃Zr₂Si₂PO₁₂ [13] - 研究成果已发布于顶级期刊《Matter》,展示了其在新能源电动汽车和电网储能等领域的实际应用价值 [3][4] 数据集构建与支持 - 构建了当前已知规模最大的高熵结构中钠离子扩散能垒(Eb)数据集,用于CGformer的预训练 [4] - 以Na₃Zr₂Si₂PO₁₂为基础,在Zr位点考虑45种潜在高熵掺杂元素,形成包含148,995种可能结构的初始化学空间,并通过多轮筛选最终得到用于微调的专用数据集 [5] - 从Materials Project数据库提取含钠结构的能量高于凸包值数据,整理成专用训练集用于评估HE-NSEs热力学稳定性 [5] 行业发展趋势 - “人工智能+材料”已成为材料科学领域的前沿研究方向,展示出学科交叉的强大发展潜力和应用价值 [16] - 该团队去年在《Energy Storage Materials》上提出的T-AIMD人工智能模型,将传统AIMD模拟速度提升了100倍以上 [17] - 德国柏林工业大学等团队也提出了深度学习架构SchNet,在分子和材料的化学性质预测中展示出强大能力 [18]