Workflow
符号回归(Symbolic Regression)
icon
搜索文档
三个大模型合作,1000次迭代,竟能像人类科学家一样发现方程
机器之心· 2025-06-21 13:06
AI4Science与符号回归技术进展 - 中国科学院自动化研究所提出DrSR框架,通过数据分析与经验归纳双轮驱动,实现类科学家的智能建模能力[1][2] - DrSR框架包含三位虚拟科学家角色:数据科学家、理论科学家、实验科学家,协同完成科学方程发现[3][7] - 该技术在物理、生物、化学、材料等跨学科建模任务中展现强大泛化能力,刷新当前最优性能[4][8] DrSR技术创新与工作机制 - 采用双路径推理机制:数据驱动的洞察生成+经验驱动的策略总结,形成闭环优化流程[16][18][28] - 包含三大核心模块:数据线索提炼(分析变量耦合/非线性趋势)、历史经验总结(建立Idea Library)、方程生成与拟合[19][20][23] - 通过残差分析定位未拟合数据段,动态优化提示质量,提升后续生成针对性[25] 性能表现与实验数据 - 在6大符号回归基准测试中,DrSR在5项取得最高准确率(Acc)和最低归一化均方误差(NMSE)[31] - 非线性阻尼振荡建模任务中达到99.94%准确率,误差低至1.8e-12,显著优于GPlearn/PySR等基线方法[31] - 收敛速度比LLM-SR快50%,有效方程生成比例高10-20%,OOD数据下误差稳定性优于同类方法[34][37][40] 典型应用案例 - 非线性阻尼振荡系统建模案例显示,DrSR在1000轮迭代内生成接近真实动力学的方程(0.8sin(x)-0.5xv-0.5v³-0.2x³),误差达10^-5级[46][48][52] - 展现三阶段智能行为:初期快速试错淘汰无效结构、中期融合非线性成分、后期精炼组合逼近真实方程[51][52] 技术应用与行业影响 - 已集成至ScienceOne智能科研平台,支持多学科可解释建模,不依赖特定大模型架构[57] - 当前局限包括输出随机性导致的冗余结构,未来将扩展多模态输入与持续学习机制[59][60][61] - 标志AI4Science从数据拟合向规律发掘演进的关键突破,推动科学智能进入新阶段[62]