Workflow
自动形式化技术
icon
搜索文档
菲尔兹奖成果首次被AI完整形式化,Gauss20万行代码改写数学史?
机器之心· 2026-03-03 16:14
核心观点 - AI在数学形式化验证领域取得突破性进展,Math, Inc.公司开发的Gauss智能体在极短时间内完成了菲尔兹奖级别数学成果的自动形式化证明,这标志着人机协作在基础科学研究中进入新阶段,并可能推动数学研究范式的变革 [6][7][22] 公司背景与技术 - Math, Inc.由xAI前联合创始人、Morph Labs首席科学家Christian Szegedy创立,致力于通过自动形式化技术打造可验证超级智能 [3] - Gauss是该公司开发的首款专为协助数学专家进行形式化验证工作的自动形式化智能体,是一种能将自然语言推理与形式化推理交织的特殊语言模型 [3][15] 技术能力与性能表现 - Gauss在2024年用三周时间完成了强素数定理在Lean中的形式化,而陶哲轩与Alex Kontorovich团队此前为此努力了18个月才取得阶段性进展 [3] - 2025年1月,功能更强大的新版Gauss仅用两三天时间就重现了之前需三周完成的强素数定理形式化成果 [18] - 针对8维最优球体堆积定理的形式化,Gauss在五天内完成,并发现并修复了已发表论文中的一个排版错误 [18] - 针对更复杂的24维最优球体堆积定理,Gauss在没有现成蓝图参考的情况下,在短短两周内自动完成了全部形式化证明,代码量超过20万行 [1][18] 项目合作与人机协作模式 - “在Lean中形式化球体填充”项目始于2024年3月,由多位数学家合作,核心是编写人类可读的“蓝图”以梳理证明组成部分 [13] - Math, Inc.在项目过程中与人类团队协作,例如分享了其完成的30个待证明中间事实,其中一个证明帮助人类团队发现了项目中的一个排版错误 [16] - 尽管24维证明是自动化工作,但公司承认人类的众多贡献为成就奠定了基础,并将此视为人类与AI通力协作的结晶 [21] 行业意义与未来展望 - 此次8维和24维球体填充证明的形式化,代表了自动形式化和人机协作的分水岭时刻 [18] - 该技术有望解放数学家,让他们更专注于构想新的数学世界,标志着数学领域一场革命性变革的开始 [22] - 数学形式化将使已知成果可搜索、可组合、可机器导航,从而加速科研进程,并深化对数学知识统一性的理解 [23] - 未来挑战在于如何在全球尺度上组织、整合与维护由AI系统产生的形式化知识,公司计划与项目维护者合作确保生成代码的长期可用性与可维护性 [23][24]
陶哲轩团队1年半项目,被他3周搞定,曾与LeCun吵翻天,如今AI大佬创业用智能体震惊整个学界?
36氪· 2025-09-12 17:01
公司核心业务与技术 - 公司致力于通过自动形式化技术打造可验证超级智能 [1] - 公司开发了自动形式化智能体Gauss 专为协助数学专家开展形式化验证工作打造 [2] - 基于Morph Labs开发的强大RL基础设施 公司通过Gauss完成了强素数定理的形式化并取得突破性成果 [1] - 公司借助Gauss智能体仅用三周时间完成了陶哲轩团队18个月未完成的项目 [3] - 通过Gauss生成了约2.5万行Lean代码 包含1000余个定理与定义 [4] - 系统可自主处理各个模块 每次能自主运行10小时以上且持续推进工作 [6] - 在每次迭代中能自主完成95%的命题形式化与证明工作 剩余部分需人工参与 [6] - 公司采用与Morph Labs合作开发的Trinity环境基础设施 支持数千个并发智能体且需占用数TB集群内存 [6] 技术突破与行业地位 - 完成了2024年1月由菲尔兹奖得主陶哲轩与Alex Kontorovich提出的挑战 即在Lean定理证明器中完成强素数定理的形式化工作 [2] - 完成了复分析领域关键缺失成果的形式化 为以往被认为难以触及的未来研究方向扫清了障碍 [3] - 生成2.5万行代码的规模在历史上属于重要里程碑 历史上最大单个形式化项目代码量约50万行 [4] - Lean标准数学库Mathlib规模约200万行代码 含35万个定理与定义 由600余名研究者耗时8年开发完成 [4] - 目标在未来12个月内将形式化代码总量提升2-3个数量级 [7] 市场反应与学术认可 - 数论家Jared Duker Lichtman认为这开启了人机协作新范式 可能开启人类与计算机之间数学的黄金时代 [7] - 物理学家Jose Ali Vivas称赞Gauss智能体令人惊叹 [7] - 威斯康星大学计算机科学教授Pedro Domingos表示人工智能天生就会做数学 [7] - 业界评价形式验证与人工智能是绝配组合 表明人工智能既能创新又严谨正确 [7] - 公司已启动技术部署工作 正与部分数学家群体接洽推进beta测试 [7] 创始人背景与行业影响 - 创始人Christian Szegedy是xAI前联合创始人 曾领导Google N2Formal团队专注于深度学习与计算机视觉研究 [8][9] - 2015年与Sergey Ioffe共同提出批归一化技术 彻底改变了深度学习训练方式并获得ICML 2025时间检验奖 [10] - 学术成果在对抗性样本领域具有里程碑意义 曾改变深度学习历史 [9] - 在xAI期间曾因LLM推理能力与LeCun公开争论 认为模型能力可进行极其深入的数学研究 [8]
陶哲轩团队1年半项目,被他3周搞定!曾与LeCun吵翻天,如今AI大佬创业用智能体震惊整个学界?
AI前线· 2025-09-12 15:13
公司业务与技术突破 - 新公司Math Inc致力于通过自动形式化技术打造可验证超级智能 专注于将人类数学成果转化为机器可验证代码[2][4] - 核心产品Gauss智能体实现超10小时自主运行 在三周内完成强素数定理形式化 而人类专家团队此前投入18个月仅取得阶段性进展[4][5] - 生成约2.5万行Lean代码 包含1000余个定理与定义 单次迭代可自主完成95%命题形式化与证明工作[5][6][8] 技术实现与基础设施 - 基于Morph Labs开发的RL基础设施与Trinity环境 支持数千个并发智能体 每个智能体拥有独立Lean运行时 占用数TB集群内存[8] - 采用Morph Cloud的Infinibranch技术解决大规模Lean验证环境的系统工程挑战[8] 行业影响与学术认可 - 完成复分析领域关键缺失成果的形式化 为以往"难以触及"的研究方向扫清障碍[5] - 数论专家Jared Duker Lichtman评价其开创"人机协作新范式" 物理学家Jose Ali Vivas与计算机教授Pedro Domingos均高度认可其技术突破[10] - 形式验证与人工智能结合被视为绝配组合 预计未来12个月内将形式化代码总量提升2-3个数量级[10] 创始人背景与历史成就 - 创始人Christian Szegedy为xAI前联合创始人 Morph Labs前首席科学家 曾领导谷歌N2Formal团队[12] - 2015年与Sergey Ioffe共同提出批归一化(BatchNorm)技术 彻底改变深度学习训练方式 获ICML 2025时间检验奖[13] - 在xAI期间曾就LLM推理能力与LeCun展开公开辩论 强调强化学习反馈循环对数学推理的重要性[12]