Workflow
AI辅助科研
icon
搜索文档
数学界无视「30年漏洞」,GPT-5一眼看穿,陶哲轩:AI科研革命开始了
36氪· 2025-11-05 18:52
文章核心观点 - 新闻核心观点是GPT-5在数学研究领域展现出实质性应用价值,通过辅助生成形式化证明和发现反例,推动了科学进步 [6][13][22][24] GPT-5在数学证明中的应用 - 两位数学家利用GPT-5在Lean中生成形式化证明并成功验证,最终证明超过6000行代码,包含26个定义、169个引理和4个定理 [13][16] - 人类研究者需不断提供反馈以完善论证,过程耗时约一周,在普通笔记本电脑上代码验证耗时不足半分钟 [16] - 陶哲轩认可此次AI辅助证明,认为这是在研究论文中负责任地使用LLM输出的罕见用例,强调Lean形式化仅是对人类证明的补充 [14][17] GPT-5在发现反例和解决开放问题中的贡献 - 加州大学欧文分校数学教授Paata Ivanisvili与合作者请GPT-5 Pro在公开未解问题中寻找反例,GPT-5提出了一个关于带擦除的非交互相关蒸馏问题的反例 [18][19][21][22] - UCLA数学教授Ernest Ryu借助GPT-5 Pro解决了一个凸优化领域的开放问题,尽管模型约80%的证明尝试错误,但提出了多条新颖思路,整个工作耗时约12小时 [24][27][29] - GPT-5的具体贡献包括给出最终可行的证明思路与论证框架,并通过快速排除无效路线大幅加速探索进程 [29] 行业影响与未来展望 - 此次GPT-5的应用被视为理论计算机科学中AI的“星星之火”,以往大语言模型多用于文献检索或数值辅助,而此次真正生成了具体、有限且可验证的反例 [24] - 研究者认为,如果大语言模型的接口能与Lean深度整合并进行微调,许多人机协作证明的问题将大大缓解,体验会更加流畅自然 [16] - OpenAI科学家Sebastien Bubeck复现了类似场景,表明GPT-5可以证明有趣的数学结论,并能筛选不正确论点、识别新推理思路以及决定探索方向 [43][44]
GPT-5破解世纪难题,竟是上网抄来的,哈萨比斯:太尴尬了
36氪· 2025-10-21 10:26
事件概述 - OpenAI团队宣称其GPT-5 Pro模型在一个周末内解决了10个埃尔德什难题 [1] - 后续澄清表明,这10个难题早已被科学界解决,GPT-5仅是通过检索网络文献找到了现有答案 [3][10] - 该事件被行业人士评价为一场“闹剧”和“自导自演”,引发了广泛争议 [1][6] 技术能力与局限性 - GPT-5在此次事件中展现的是文献检索能力,而非独立解决未解数学难题的能力 [3][10] - 有观点认为,尽管存在争议,但GPT-5在高效完成文献检索方面表现依然出色 [18] - 行业专家指出,人工智能在数学领域更现实的作用是使用中等水平工具辅助处理研究中的琐碎工作,而非直接攻克最难题 [19] 行业反响与评价 - 谷歌DeepMind首席执行官Demis Hassabis公开评论此事“太尴尬了” [1][3] - 图灵奖得主Yann LeCun在社交媒体上嘲讽此举是“搬起石头砸自己的脚” [5] - 研究人员明确表示其原意并非宣称GPT-5破解难题,而是通过数千条查询找到了十个问题的解 [6] 对AI科研的启示 - 开发者强调必须谨慎对待任何关于人工智能发现新科学或数学成果的说法 [15] - 行业观点认为,关于人工智能的科学发现需要更多的同行评审 [17] - 尽管需要对人工智能的原创发现保持审慎,但人工智能辅助科研被视为未来的必经之路 [20]
MIT爆火论文被曝数据造假!曾验证AI辅助科研增速44%,诺奖得主都被诓了
量子位· 2025-05-21 04:33
西风 发自 凹非寺 量子位 | 公众号 QbitAI 「 AI对科学 发现影响的最 佳论文 」被曝造假,MIT发声明与其划清界限! 要知道,这项研究当时一经发表就轰动学术圈,包括Nature在内都争相报道,诺奖得主也为其点赞。 它表明,研究人员使用AI辅助后, 新材 料发现量增加44 %、专利申请量增加39%、下游产品创新提升17% 。 校方严正声明: 该论文应从公共讨论中撤回。 MIT对论文中数据的来源、可靠性、有效性缺乏信心,对论文研究的真实性亦缺乏信心。 目前,该论文作者已离开MIT,相关论文暂未从arxiv上下架。 一系列让人感到意外的数据 这篇论文2024年11月发表在arXiv上,同时向学术期刊《经济学季刊》投稿,也就意味着原本可能即将正式发布。 论文题为" Artificial Intelligence, Scientific Discovery, and Product Innovation ",作者只有 Aidan Toner-Rodgers 一个人,论文 发布时是 MIT经济系博士生 。 但半年时间不到,它就 因涉嫌关键实验数据造假 ,而被MIT责令撤稿。 论文主要内容是通过对美国一家大型 ...