陶哲轩惊叹,数学奇点初现,AI首次给出人类无法企及的原创证明
36氪·2026-01-16 08:13

AI在数学研究领域的突破性进展 - 谷歌DeepMind团队利用Gemini模型证明了一个代数几何领域全新的定理,论文核心成果的证明过程在Gemini模型及其相关工具(DeepThink系统、FullProof系统)的推动下得以实现 [3][8] - 斯坦福大学教授、美国数学会会长Ravi Vakil亲自认证Gemini提供了关键且独创的洞见,其论证严谨、正确且优雅,并非对既有证明的简单改写 [12] - Ravi Vakil教授认为此次进展是“人类智慧与Gemini贡献之间的真实协同”,并曾预计AI对数学的影响将是“相变”,而非缓慢爬坡 [14][16] AI在解决具体数学问题上的能力展示 - 马斯克的Grok 4.20模型在5分钟内解决了困扰教授的Bellman函数难题,给出了一个漂亮的显式公式:U(p,q) = E √(q²+τ) [23] - Grok 4.20的解决方案将下界精度从约 p√log(1/p) 级别提升至 p log(1/p) 级别,实现了对数因子上的“平方根级别飞跃”,并且该下界被证实是“紧确的” [24][25][30] - 在调和分析领域,Grok 4.20将二进平方函数L¹范数的下界纪录从 |A|(1-|A|)√log(...) 级别,提升至 |A|(1-|A|) log(...) 级别 [29] AI在攻克埃尔德什问题集上的表现 - 自GPT 5.2发布以来,从圣诞节至今已有15道埃尔德什题目从“未解”变为“已解”,其中11道明确标注AI模型在解题中发挥了关键作用 [38] - 数学家陶哲轩统计,目前AI模型在8道埃尔德什难题上实现了“自主推进式”的实质性进展,还有6道是通过查找和延续已有研究取得突破 [38] - 陶哲轩提出“AI扩展”猜想,认为AI非常适合系统性地清理那些相对容易的“长尾”埃尔德什难题,并猜测现有AI工具能直接攻克约1%到2%的未解埃尔德什难题 [38][41] 行业影响与未来展望 - 谷歌Gemini与马斯克Grok等AI工具已在数学领域遍地开花,正式叩响思想创造之门,AI与人类天才之间的差距正在缩小 [4][10] - 数学界的研究范式正在被AI重塑,无论是Aristotle等专用AI助手,还是GPT-5.2等通用大模型,都在改变对“数学探索者”的传统想象 [41] - 有观点预测2026年将是“ASI(超级人工智能)元年”,未来可能形成“人类负责定义问题,AI负责填补证明空白”的共生模式 [4]