Gauss
搜索文档
AI Agent搞定世纪首次菲尔兹奖成果形式化!一周时间独立完成,20万行代码已公开
量子位· 2026-03-03 18:11
文章核心观点 - AI(Math公司的Gauss)在极短时间内完成了对菲尔兹奖级数学成果的形式化证明,这标志着自动形式化领域取得了重大突破,被类比为“ImageNet时刻”,预示着AI将彻底改变数学知识体系和发现方式 [1][2][19][27] AI成就与技术突破 - **效率突破**:Gauss仅用**5天时间**完成了原本需要**6个月**才能完成的8维情形形式化验证,新增约**5万行**Lean代码 [16][17] - **规模突破**:整个项目(8维和24维)最终生成约**20万行**Lean代码(经优化后),是历史上最大规模的单一目的Lean形式化项目 [6][20] - **能力突破**:AI在推理过程中自主检测并纠正了原论文中的细节错误(如Prop 7中函数b(t)计算缺负号),证明了其独立推演和验证复杂证明的能力 [7][18] - **连续突破**:在完成8维证明后,Gauss又用**一周时间**,研究了原论文和**20+篇**参考文献,生成**45万行**代码(峰值),完成了24维情形的形式化证明 [17][20] 项目背景与数学意义 - **证明对象**:形式化验证了Maryna Viazovska在2022年获得菲尔兹奖的成果,即关于**8维和24维最优球体堆积问题**的定理 [4][8] - **问题难度**:高维球体堆积问题极为复杂,三维情形的证明(1998年)及其形式化验证就耗费了十余年,Viazovska的创新方法(结合傅里叶分析与模形式)是解决8维和24维问题的关键 [10][11] - **历史意义**:这是**本世纪以来首次**有菲尔兹奖成果被完全形式化 [5] - **项目历程**:人类专家团队在前两年编写了约**2万行**代码,Gauss于2025年11月加入项目并最终主导完成了剩余全部工作 [15][16] 公司及AI产品(Gauss)背景 - **开发公司**:Gauss由Math Inc.开发,该公司由xAI联合创始人、BatchNorm作者Christian Szegedy于2025年创立 [22][23] - **公司使命**:致力于用AI“解决数学,解决一切” [23] - **产品声誉**:Gauss此前已因用**3周时间**形式化了陶哲轩等提出的**强素数定理(PNT)** 而闻名,并与陶哲轩有合作项目 [25][26] - **代码开源**:本次菲尔兹奖成果的形式化代码已在GitHub上发布 [21] 行业影响与未来展望 - **能力认可**:验证表明,以Gauss为代表的AI智能体已具备加速数学前沿研究发展的能力 [18] - **变革潜力**:扩大自动形式化的规模,将使全部已知数学成果变得可检索,从而**彻底变革数学知识体系和数学发现方式** [19] - **超越预期**:此次突破远超数学家们两年前的预期,当时认为AI要达到协助完成此类工作的水平尚需多年 [26]
菲尔兹奖成果首次被AI完整形式化,Gauss20万行代码改写数学史?
机器之心· 2026-03-03 16:14
核心观点 - AI在数学形式化验证领域取得突破性进展,Math, Inc.公司开发的Gauss智能体在极短时间内完成了菲尔兹奖级别数学成果的自动形式化证明,这标志着人机协作在基础科学研究中进入新阶段,并可能推动数学研究范式的变革 [6][7][22] 公司背景与技术 - Math, Inc.由xAI前联合创始人、Morph Labs首席科学家Christian Szegedy创立,致力于通过自动形式化技术打造可验证超级智能 [3] - Gauss是该公司开发的首款专为协助数学专家进行形式化验证工作的自动形式化智能体,是一种能将自然语言推理与形式化推理交织的特殊语言模型 [3][15] 技术能力与性能表现 - Gauss在2024年用三周时间完成了强素数定理在Lean中的形式化,而陶哲轩与Alex Kontorovich团队此前为此努力了18个月才取得阶段性进展 [3] - 2025年1月,功能更强大的新版Gauss仅用两三天时间就重现了之前需三周完成的强素数定理形式化成果 [18] - 针对8维最优球体堆积定理的形式化,Gauss在五天内完成,并发现并修复了已发表论文中的一个排版错误 [18] - 针对更复杂的24维最优球体堆积定理,Gauss在没有现成蓝图参考的情况下,在短短两周内自动完成了全部形式化证明,代码量超过20万行 [1][18] 项目合作与人机协作模式 - “在Lean中形式化球体填充”项目始于2024年3月,由多位数学家合作,核心是编写人类可读的“蓝图”以梳理证明组成部分 [13] - Math, Inc.在项目过程中与人类团队协作,例如分享了其完成的30个待证明中间事实,其中一个证明帮助人类团队发现了项目中的一个排版错误 [16] - 尽管24维证明是自动化工作,但公司承认人类的众多贡献为成就奠定了基础,并将此视为人类与AI通力协作的结晶 [21] 行业意义与未来展望 - 此次8维和24维球体填充证明的形式化,代表了自动形式化和人机协作的分水岭时刻 [18] - 该技术有望解放数学家,让他们更专注于构想新的数学世界,标志着数学领域一场革命性变革的开始 [22] - 数学形式化将使已知成果可搜索、可组合、可机器导航,从而加速科研进程,并深化对数学知识统一性的理解 [23] - 未来挑战在于如何在全球尺度上组织、整合与维护由AI系统产生的形式化知识,公司计划与项目维护者合作确保生成代码的长期可用性与可维护性 [23][24]
腾讯研究院AI速递 20250915
腾讯研究院· 2025-09-15 00:01
OpenAI与微软合作及发展前景 - OpenAI与微软发布非约束性合作备忘录 涉及云服务托管 知识产权归属和AGI控制权等核心问题 但最终合作条约仍未确定[1] - OpenAI预计成立估值超1000亿美元的公益公司(PBC) 非营利机构将持有股权并保持控制权 成为全球资源最充足的慈善组织之一[1] - OpenAI面临巨大成本压力 预计2029年前烧掉1150亿美元 仅2030年就需花费1000亿美元租赁服务器 未来几年几乎没有容错空间[1] AI影视内容创作突破 - 前谷歌X团队创立全球首家AI原生影视工作室Utopai 两部电影项目已带来1.1亿美元收入 锁定戛纳电影节[2] - Utopai突破AI视频生成三大难题:一致性 可控性和叙事延续性 实现毫秒级精准对口型 模型内置物理规律的3D数据训练[2] - 公司定位为内容+AI而非纯工具供应商 已获好莱坞顶级资源支持 为电影《科尔特斯》邀请奥斯卡提名编剧 八集科幻剧《太空计划》成功预售欧洲市场[2] 音乐生成技术进展 - MiniMax发布新一代音乐生成模型Music 1.5 支持长达4分钟的完整歌曲创作 具备强控制力 人声自然饱满 编曲层次丰富和歌曲结构清晰四大突破[3] - 模型支持"16种风格×11种情绪×10个场景"自定义音乐特征 能生成不同声线唱腔 并支持中国民族乐器生成 真正实现Intro/Verse/Chorus段落分明[3] - 基于MiniMax多模态自研能力积累 同步面向全球开发者提供API 适用于专业音乐创作 影视游戏配乐 虚拟偶像单曲和企业品牌专属音频内容多种场景[3] 本地生活AI应用发展 - 美团首个AI Agent产品"小美"开启公测 通过自然语言指令点咖啡 找餐厅 规划早餐菜单 大幅简化点餐流程[4] - 小美基于美团自研Longcat模型(5600亿总参数) 能根据用户口味偏好和地理位置实现从选品到支付的全自动操作 并记忆用户习惯[4] - 与Agent热潮相呼应 但目前仍有局限性:无法处理复杂模糊需求 无法进行语音回复 未来将在个性化和主动服务能力上进一步优化[4] 语音合成技术创新 - 小红书智创音频技术团队发布新一代对话合成模型FireRedTTS-2 解决现有方案灵活性差 发音错误多 说话人切换不稳定和韵律不自然等问题[5] - 模型在数百万小时语音数据上训练 支持逐句生成与多说话人音色切换 能够通过一句语音样本模仿音色和说话习惯 流式解码可实时输出音频[6] - 在主客观评测中均达行业领先水平 开箱即用支持中文 英语 日语等多语言 是AI播客等对话合成应用的工业级解决方案 已开源代码与模型权重[6] 开源语音合成技术突破 - 哔哩哔哩开源新一代零样本语音合成模型IndexTTS2 实现毫秒级精准时长控制 让AI配音能严丝合缝对上口型[7] - 模型采用"通用且兼容自回归架构的语音时长控制方法" 达到0.02%的时长误差率 同时通过两阶段训练策略实现情感和说话人身份的"解耦"[7] - 系统由T2S(文本到语义) S2M(语义到梅尔频谱)及BigVGANv2声码器三大核心模块组成 支持用大白话控制情绪 在跨语言产业应用上具有重大意义[7] 小型高效模型发展 - Meta AI发布MobileLLM-R1系列小参数高效模型 包括140M/360M/950M三种规模 专为数学 编程和科学问题优化[8] - 最大的950M模型仅使用约2T高质量token预训练(总训练量不足5T) 性能却与使用36T token训练的Qwen3 0.6B相当或更佳[8] - 在MATH基准上比Olmo 1.24B高五倍 比SmolLM2 1.7B高两倍 Token效率和性价比极高 完全开源模型中创造新标杆[8] AI数学研究突破 - 名为"Gauss"的AI Agent仅用三周时间完成了陶哲轩团队18个月未能完成的数学挑战——在Lean中形式化强素数定理(PNT)[9] - 该Agent由Math公司开发 生成约25000行Lean代码包含上千个定理和定义[9] - Gauss能协助顶级数学家进行形式验证 突破了复分析核心难题 团队计划在未来12个月让形式化代码总量提升100到1000倍[9] AI产业格局演变 - OpenAI推出GPT-5 首次真正让人感觉与博士级专家对话 内置"思考"能力 统一模型取代复杂选择界面 显著减少幻觉[10] - 发布前其他玩家也纷纷推出战略性新品:Anthropic推出Claude Opus 4.1瞄准高风险企业场景 Google推出Gemini 2.5 Deep Think和Genie 3分别强化推理和模拟能力[10] - 新AI版图已重新排布:OpenAI同时占据开放与封闭AI生态主导地位 Anthropic专注企业级精准稳定 Google专注基础研究长期布局 Agentic AI 先进推理和端侧能力已成顶尖模型核心特性[11] 科研AI战略布局 - DeepMind科学团队只瞄准三类问题:具有变革性 公认5-10年内无人能解 但DeepMind有信心快速攻克的"不可能任务"[12] - 团队从专用模型到通用智能的进化:将AlphaProof等专用数学模型的能力成功转移到Gemini通用模型 使DeepThink实现IMO金牌水平[12] - 未来目标是打造"科学API" 让全球科学家共享AI能力 从AlphaFold数据库到AI Co-scientist 降低科研门槛 使普通人也能做出诺贝尔奖级贡献[12]
陶哲轩18个月没搞定的数学挑战,被这个“AI高斯”三周完成了
36氪· 2025-09-14 13:16
核心观点 - 人工智能公司Math开发的AI智能体Gauss在数学形式化验证领域取得重大突破 仅用三周时间完成陶哲轩等数学家18个月未能解决的强素数定理形式化挑战 展示出AI在复杂数学问题求解上的巨大潜力 [1][2][4][6] 技术突破 - Gauss作为首个协助顶级数学家进行形式验证的自动形式化Agent 能够将人类数学内容转换为机器可读的形式语言并验证正确性 [4][5] - 该智能体生成约25000行Lean代码 包含上千个定理和定义 这种规模的形式化证明传统上需要多年时间完成 [7] - 项目突破复分析核心难题 Gauss作为硅基生命可持续工作 极大压缩顶尖形式化专家的工作量 [6] 性能表现 - 相比历史上最大的单个形式化项目(最多50万行代码) Gauss的产出规模达到同数量级 [7] - Lean标准数学库Mathlib包含200万行代码和35万个定理 由600多位贡献者耗时8年完成 而Gauss三周的产出效率显著超越人类团队 [7] - 团队计划在未来12个月内将形式化代码总量提升100到1000倍 目标实现"可验证的超级智能"和"通才型机器数学家" [9] 基础设施 - 为支撑Gauss运行 团队与Morph Labs合作开发Trinity环境基础设施 [8] - 系统涉及数千个并发Agent 每个Agent拥有独立Lean运行环境 消耗数TB集群内存 属于复杂系统工程挑战 [8] 团队背景 - Math公司创始人Christian Szegedy为ICML'25时间检验奖得主 其2015年提出的Batch Normalization技术引用量超过6万次 是深度学习领域的里程碑突破 [13][15][17] 行业影响 - AI工具采用与人类截然不同的方法 可能专注于明确目标而忽略隐含目标 这要求项目组织者需要更明确阐述所有目标 [10][11] - 陶哲轩指出随着强大AI工具出现 需要重新评估形式化项目的多重目标 包括知识传承、社区建设等隐含价值 [10][11]
啥?陶哲轩18个月没搞定的数学挑战,被这个“AI高斯”三周完成了
量子位· 2025-09-14 13:05
核心观点 - Gauss AI Agent在数学形式化领域取得突破性进展 仅用三周时间完成陶哲轩等人18个月未完成的强素数定理形式化挑战 展现AI在复杂数学验证任务中的巨大潜力 [1][2][8] 技术突破 - 生成约25000行Lean代码 包含上千个定理和定义 此类规模的形式化证明传统需多年完成 [10][11] - 项目规模达历史最大单个形式化项目的十分之一级别(历史最大项目为50万行代码) [12] - 对比Lean标准数学库Mathlib的200万行代码(35万个定理)由600多位贡献者耗时8年完成 Gauss效率显著提升 [13] 基础设施要求 - 与Morph Labs合作开发Trinity环境基础设施 支持数千个并发Agent运行 [14] - 每个Agent需独立Lean运行环境 集群内存消耗达数TB级别 属于复杂系统工程挑战 [14] 发展目标 - 计划未来12个月内将形式化代码总量提升100到1000倍 [16] - 致力于构建"可验证的超级智能"和"通才型机器数学家"新范式 [17] 团队背景 - 母公司Math由Christian Szegedy创立 其为2015年Batch Normalization技术共同发明人 [22][24] - Batch Normalization是深度学习从实验走向大规模实用化的关键技术之一 [26] 行业影响 - AI工具可能改变传统形式化项目中明确目标与隐含目标的实现方式 需重新定义项目目标体系 [18][19] - 陶哲轩指出AI优化算法可能专注于名义目标而忽略隐含目标(如社区建设、知识传承等) [19]
陶哲轩团队1年半项目,被他3周搞定,曾与LeCun吵翻天,如今AI大佬创业用智能体震惊整个学界?
36氪· 2025-09-12 17:01
公司核心业务与技术 - 公司致力于通过自动形式化技术打造可验证超级智能 [1] - 公司开发了自动形式化智能体Gauss 专为协助数学专家开展形式化验证工作打造 [2] - 基于Morph Labs开发的强大RL基础设施 公司通过Gauss完成了强素数定理的形式化并取得突破性成果 [1] - 公司借助Gauss智能体仅用三周时间完成了陶哲轩团队18个月未完成的项目 [3] - 通过Gauss生成了约2.5万行Lean代码 包含1000余个定理与定义 [4] - 系统可自主处理各个模块 每次能自主运行10小时以上且持续推进工作 [6] - 在每次迭代中能自主完成95%的命题形式化与证明工作 剩余部分需人工参与 [6] - 公司采用与Morph Labs合作开发的Trinity环境基础设施 支持数千个并发智能体且需占用数TB集群内存 [6] 技术突破与行业地位 - 完成了2024年1月由菲尔兹奖得主陶哲轩与Alex Kontorovich提出的挑战 即在Lean定理证明器中完成强素数定理的形式化工作 [2] - 完成了复分析领域关键缺失成果的形式化 为以往被认为难以触及的未来研究方向扫清了障碍 [3] - 生成2.5万行代码的规模在历史上属于重要里程碑 历史上最大单个形式化项目代码量约50万行 [4] - Lean标准数学库Mathlib规模约200万行代码 含35万个定理与定义 由600余名研究者耗时8年开发完成 [4] - 目标在未来12个月内将形式化代码总量提升2-3个数量级 [7] 市场反应与学术认可 - 数论家Jared Duker Lichtman认为这开启了人机协作新范式 可能开启人类与计算机之间数学的黄金时代 [7] - 物理学家Jose Ali Vivas称赞Gauss智能体令人惊叹 [7] - 威斯康星大学计算机科学教授Pedro Domingos表示人工智能天生就会做数学 [7] - 业界评价形式验证与人工智能是绝配组合 表明人工智能既能创新又严谨正确 [7] - 公司已启动技术部署工作 正与部分数学家群体接洽推进beta测试 [7] 创始人背景与行业影响 - 创始人Christian Szegedy是xAI前联合创始人 曾领导Google N2Formal团队专注于深度学习与计算机视觉研究 [8][9] - 2015年与Sergey Ioffe共同提出批归一化技术 彻底改变了深度学习训练方式并获得ICML 2025时间检验奖 [10] - 学术成果在对抗性样本领域具有里程碑意义 曾改变深度学习历史 [9] - 在xAI期间曾因LLM推理能力与LeCun公开争论 认为模型能力可进行极其深入的数学研究 [8]
陶哲轩团队1年半项目,被他3周搞定!曾与LeCun吵翻天,如今AI大佬创业用智能体震惊整个学界?
AI前线· 2025-09-12 15:13
公司业务与技术突破 - 新公司Math Inc致力于通过自动形式化技术打造可验证超级智能 专注于将人类数学成果转化为机器可验证代码[2][4] - 核心产品Gauss智能体实现超10小时自主运行 在三周内完成强素数定理形式化 而人类专家团队此前投入18个月仅取得阶段性进展[4][5] - 生成约2.5万行Lean代码 包含1000余个定理与定义 单次迭代可自主完成95%命题形式化与证明工作[5][6][8] 技术实现与基础设施 - 基于Morph Labs开发的RL基础设施与Trinity环境 支持数千个并发智能体 每个智能体拥有独立Lean运行时 占用数TB集群内存[8] - 采用Morph Cloud的Infinibranch技术解决大规模Lean验证环境的系统工程挑战[8] 行业影响与学术认可 - 完成复分析领域关键缺失成果的形式化 为以往"难以触及"的研究方向扫清障碍[5] - 数论专家Jared Duker Lichtman评价其开创"人机协作新范式" 物理学家Jose Ali Vivas与计算机教授Pedro Domingos均高度认可其技术突破[10] - 形式验证与人工智能结合被视为绝配组合 预计未来12个月内将形式化代码总量提升2-3个数量级[10] 创始人背景与历史成就 - 创始人Christian Szegedy为xAI前联合创始人 Morph Labs前首席科学家 曾领导谷歌N2Formal团队[12] - 2015年与Sergey Ioffe共同提出批归一化(BatchNorm)技术 彻底改变深度学习训练方式 获ICML 2025时间检验奖[13] - 在xAI期间曾就LLM推理能力与LeCun展开公开辩论 强调强化学习反馈循环对数学推理的重要性[12]