Workflow
组合数学
icon
搜索文档
30年数学难题,AI仅6小时告破,陶哲轩:ChatGPT们都失败了
36氪· 2025-12-01 16:56
昨晚,数学界炸了!AI数学家「亚里士多德」竟在6个小时内,一键破解了30年难题的简版,引陶哲轩盛赞。数学领域Vibe proving时代来了。 30年未解数学难题,终于告破! 由HarmonicMath开发的AI数学家「亚里士多德」(Aristotle),100%独立完成了埃尔德什问题#124。 它在Lean证明系统中,耗时仅6个小时,验证只需1分钟。 全程没有一丝人类的参与辅助,这一刻,堪称数学界的「登月」时刻。 HarmonicMath创始人Vlad Tenev感慨道,「数学圈正迎来巨变,vibe证明的时代,来了」! 就连菲尔兹奖得主陶哲轩,高度赞扬了AI数学家「亚里士多德」。 AI发现数学的时代,正式开始了。 30年难题告破,AI做到了 一直以来,数学家Erdős Pál的「问题列表」,就像一座知识的珠穆朗玛峰,考验着人类的极限。 那些悬而未决的难题,悬赏金大多从几十美元到上万美元不等。 其象征意义远大于实际价值,成为了无数数学家的精神勋章。 30年来,第124号问题(Erdős #124)在论文「Complete sequences of sets of integer powers」中提出后,至今无 ...
GPT-5通过“哥德尔测试”!独创性解决博士生都得花几天时间的开放数学问题
量子位· 2025-09-25 21:00
文章核心观点 - GPT-5在解决高等数学中未解决的优化猜想方面展现出显著能力,在五道题中成功解出三道[1][2] - GPT-5不仅能够复现已知证明路径,甚至对其中一道题给出了与研究者预期不同但同样有效的证明方案[2][39] - 该测试表明GPT-5具备解决真正开放性数学问题的潜力,其数学推理能力相比早期模型有显著提升[5][26] 测试背景与性质 - 此次测试被称为“哥德尔测试”,挑战的是需要博士水平研究者花费数天才能完成的未解决数学猜想,而非为人类高中生设计的奥林匹克竞赛题[3][8][10] - 测试问题集中于组合数学的子领域——子模最大化,该领域核心是研究边际收益递减的优化问题[12][13][16] - 测试要求模型在仅提供最小化描述和参考文献、无解题提示的情况下,自主生成包含可量化性能保证的严格数学证明[21][24] GPT-5在各题目的具体表现 - **第一题(最大化“单调+非单调”子模函数)**:GPT-5沿最“贪心”方向微调解,利用函数结构保证结果接近最优,证明总体正确[22][23][27] - **第二题(子模函数最大化的双重标准算法)**:GPT-5给出的答案比研究者最初猜想更合理,推导基本正确,但存在忽略特例下更精确数字的小问题[33][39][40] - **第三题(凸集合约束下最大化连续单调函数)**:GPT-5回答正确性较高,但在被要求生成新证明版本时,仍存在细节和可读性问题[45][59][62] - **第四题与第五题**:GPT-5均未成功,这两题需要结合至少两个不同文献的洞见,其综合推理能力是主要局限之一[26][63][73][81] 模型能力评估与局限 - GPT-5在基础数学能力上显示出明显提升,并偶尔展现独创性,但输出可能表面上正确而本质上错误,存在深层次缺陷[26] - 提示词对性能影响显著,当被要求提供完整证明时,GPT-5更倾向于保留中间步骤,生成更完整和自洽的解答[26] - 模型倾向于跳过未变步骤并严格模仿原始结构,而非寻求更自然的替代方法,类似人类的偷懒行为[26][41]
速递|斯坦福90后中国数学博士的AI公司,未出产品先融资5000万美元,B Capital正洽谈领投
Z Potentials· 2025-06-04 10:42
数学AI初创公司Axiom - 斯坦福大学数学博士生Carina Hong创立Axiom 致力于开发基于形式化数学证明训练的AI 目标估值3亿至5亿美元 正筹集5000万美元资金 [2] - Axiom计划将产品出售给对冲基金和量化交易公司 帮助解决涉及资产价值和股票市场的复杂数学问题 [3] - 公司开发方向是利用编程语言训练机器掌握形式化证明语言 而非仅回答问题 [6] 数学AI行业动态 - OpenAI的o4-mini在FrontierMath评估中超越人类数学家团队 谷歌AI达到国际数学奥林匹克金牌水平 [4] - 主流AI模型如Anthropic OpenAI和谷歌在基础数学问题仍存在错误 但复杂查询处理展现潜力 [3] - 谷歌AI模型存在组合数学领域的短板 恰为Carina Hong的专长领域 [5] 竞争格局 - 类似数学AI初创公司Harmonic由Robinhood CEO创立 2023年以3 25亿美元估值融资7500万美元 [6] - 投资者对专业数学AI模型仍保持兴趣 尽管部分认为自主模型开发窗口期已过 [3] 创始人背景 - Carina Hong拥有MIT数学与物理学位 牛津大学深造经历 斯坦福在读 发表过组合数学领域论文 [3] - 曾指出主流AI模型数学表现优异可能源于训练数据包含考题 而非真正掌握证明能力 [6]