Workflow
AI辅助数学研究
icon
搜索文档
清华AI数学家系统攻克均匀化理论难题!人机协同完成17页严谨证明
量子位· 2025-11-04 16:22
这一突破,也让AI真正踏入了"原创科研"的核心地带,为未来数学发现的方式打开了新的想象空间。 数学研究的"AI困境" 近年来,AI在数学领域的表现屡获突破: 然而,这些成果多集中在"短时间、标准化"的竞赛类任务中,与真实数学研究的需求存在巨大鸿沟。 清华AIR团队 投稿 量子位 | 公众号 QbitAI 当AI不再只是解题机器,而能与人类并肩完成严谨的科研证明,这意味着什么? 清华大学科研团队以自主研发的 AI数学家系统(AIM) 为协作伙伴,通过人机交互的模式成功解决了一项均匀化理论研究问题,形成约17 页数学证明。 该成果系统性验证了AI从"数学解题工具"升级为 "科研协作伙伴" 的可行性,为复杂数学问题的突破提供了新路径。 当前主流AI系统在数学研究中存在明显局限:FunSearch、AlphaEvolve等依赖问题的程序化表述,仅适用于部分数学领域; AlphaGeometry系列则聚焦几何推理,难以覆盖更广泛的数学分支。 即便部分AI能提供碎片化见解,完整证明的构建与验证仍需依赖人类,难以真正融入研究全流程。 该研究的核心目标正是打破这一困境, 通过构建"人类分析+AI推导"的协同范式,让AI的推理 ...
陶哲轩用GPT5-Pro跨界挑战,3年无解的难题,11分钟出完整证明
36氪· 2025-10-11 17:23
AI在数学研究中的应用进展 - 陶哲轩与GPT-5 Pro合作解决了一个微分几何领域悬置3年的开放问题,该问题涉及三维光滑拓扑球面在主曲率绝对值不超过1的条件下所围体积的最小值问题[1][3] - GPT-5 Pro在11分18秒内完成了复杂计算并提供了完整证明,运用了Stokes定理、Willmore不等式和Minkowski第一积分公式等工具[5] - AI在验证证明步骤时提供了两种不同证明路径:基于散度定理的方法和基于流方法的新思路[7] AI辅助研究的效果评估 - 陶哲轩将AI的价值分为三个尺度:小尺度上表现良好,贡献了有用想法且只犯小错误;中尺度上略显无益,强化了错误直觉;大尺度上间接有帮助,能快速验证并放弃不适用方法[11][12][14] - 在数值搜索任务中,AI工具可节省大量时间,通过逐步对话执行启发式计算并找到可行参数选择[29] - 与GPT-4相比,GPT-5 Pro在解决复杂数学问题方面有显著进步,但仍有局限性,特别是在复杂分析问题上缺乏关键概念思想[27] AI工具的发展历程 - 从ChatGPT早期只能提供表面合理但缺乏实质深度的回答,到GPT-4已能处理统计数据并在几分钟内完成人类一天的工作量[21][22] - GPT-4在熟悉领域数学问题中能提出八种不同解决方法,其中生成函数法被证明比传统渐近分析方法更有效[23][25] - GPT-o1解决了前代的幻觉问题,在形式化任务中作用显著,被评价为"平庸但并非完全无能"的数学研究生水平[27] 人机协作模式优化 - 最优自动化水平严格介于0%和100%之间,需要足够自动化减少重复工作,同时保持"人在回路中"审查局部问题[18] - 减少AI幻觉的有效方法包括在计算任务每一步详细解释、对话中先确认再执行、对话后使用Python进行外部验证[29] - AI最合理的角色是数学家的"副驾驶"或助理,而非取代人类在创造性、直觉性和策略性方面的工作[31]