OpenAI「解决」10道数学难题？哈萨比斯直呼「尴尬」，LeCun辛辣点评

事件概述 - 事件核心为OpenAI研究员宣称GPT-5模型“发现”了10个Erdős数学难题的解决方法，但后续被证实仅是检索到了已存在的文献，引发了关于AI能力夸大宣传的讨论 [1][14][16] 事件经过 - 2025年10月12日，OpenAI研究员Sebastien Bubeck发推称GPT-5在文献搜索方面表现超凡，解决了官方数据库中标记为未解的Erdős问题339，并指出该问题实际在20年前（2003年）已被解决 [4][5] - 10月17日，OpenAI研究人员Mark Sellke更新称，通过数千次查询，使用GPT-5模型对Erdős问题网站进行调查，“发现”了10个问题的解决方案（问题编号：223、339、494、515、621、822、883、903、1043、1079），并在另外11个问题上取得部分进展 [6][8] - OpenAI高管（如首席产品官Kevin Weil、副总裁Sebastien Bubeck）转发相关帖文，并宣称“AI加速科学已正式开始”，导致公众和媒体普遍误认为GPT-5在数学推理上取得重大突破 [9][12][14] - 事件迅速反转，谷歌DeepMind CEO Demis Hassabis指出其表述“很尴尬”，并引导关注网站维护者数学家Thomas Bloom的澄清 [16][17] - Thomas Bloom澄清称，网站将问题标记为“未解决”仅代表其个人不知晓解答已发表，并非数学界未解决，GPT-5实际扮演了高效学术搜索引擎的角色 [17][18] - 随后，Sebastien Bubeck和Kevin Weil均删除帖文并道歉，承认表述造成误解 [18][19] 行业反响与讨论 - Meta首席AI科学家Yann LeCun等人指出，过去几个月对大型语言模型（LLM）是“灾难性的”，列举了包括苹果推理论文证实LLM无法解决分布偏移、GPT-5发布延迟且表现不及预期、图灵奖得主Rich Sutton同意对LLM的批评、以及Karpathy认为智能体技术远未成熟且AGI还需十年等事例 [25][26][27][28][29][30] - 数学家陶哲轩（Terence Tao）认为，AI在数学领域的近期潜力在于使用中等强度工具加速平凡但耗时的研究任务（如文献综述），而非直接解决最难题，并强调人类专家需指导、验证并整合AI输出 [33][34][35][36] - 有观点指出，AI实验室存在因融资压力而进行夸大宣传的激励问题，因为同行评审耗时数月，而发布新闻稿只需几秒 [38]