Workflow
AI辅助科研
icon
搜索文档
数学界无视「30年漏洞」,GPT-5一眼看穿,陶哲轩:AI科研革命开始了
36氪· 2025-11-05 18:52
文章核心观点 - 新闻核心观点是GPT-5在数学研究领域展现出实质性应用价值,通过辅助生成形式化证明和发现反例,推动了科学进步 [6][13][22][24] GPT-5在数学证明中的应用 - 两位数学家利用GPT-5在Lean中生成形式化证明并成功验证,最终证明超过6000行代码,包含26个定义、169个引理和4个定理 [13][16] - 人类研究者需不断提供反馈以完善论证,过程耗时约一周,在普通笔记本电脑上代码验证耗时不足半分钟 [16] - 陶哲轩认可此次AI辅助证明,认为这是在研究论文中负责任地使用LLM输出的罕见用例,强调Lean形式化仅是对人类证明的补充 [14][17] GPT-5在发现反例和解决开放问题中的贡献 - 加州大学欧文分校数学教授Paata Ivanisvili与合作者请GPT-5 Pro在公开未解问题中寻找反例,GPT-5提出了一个关于带擦除的非交互相关蒸馏问题的反例 [18][19][21][22] - UCLA数学教授Ernest Ryu借助GPT-5 Pro解决了一个凸优化领域的开放问题,尽管模型约80%的证明尝试错误,但提出了多条新颖思路,整个工作耗时约12小时 [24][27][29] - GPT-5的具体贡献包括给出最终可行的证明思路与论证框架,并通过快速排除无效路线大幅加速探索进程 [29] 行业影响与未来展望 - 此次GPT-5的应用被视为理论计算机科学中AI的“星星之火”,以往大语言模型多用于文献检索或数值辅助,而此次真正生成了具体、有限且可验证的反例 [24] - 研究者认为,如果大语言模型的接口能与Lean深度整合并进行微调,许多人机协作证明的问题将大大缓解,体验会更加流畅自然 [16] - OpenAI科学家Sebastien Bubeck复现了类似场景,表明GPT-5可以证明有趣的数学结论,并能筛选不正确论点、识别新推理思路以及决定探索方向 [43][44]
GPT-5破解世纪难题,竟是上网抄来的,哈萨比斯:太尴尬了
36氪· 2025-10-21 10:26
事件概述 - OpenAI团队宣称其GPT-5 Pro模型在一个周末内解决了10个埃尔德什难题 [1] - 后续澄清表明,这10个难题早已被科学界解决,GPT-5仅是通过检索网络文献找到了现有答案 [3][10] - 该事件被行业人士评价为一场“闹剧”和“自导自演”,引发了广泛争议 [1][6] 技术能力与局限性 - GPT-5在此次事件中展现的是文献检索能力,而非独立解决未解数学难题的能力 [3][10] - 有观点认为,尽管存在争议,但GPT-5在高效完成文献检索方面表现依然出色 [18] - 行业专家指出,人工智能在数学领域更现实的作用是使用中等水平工具辅助处理研究中的琐碎工作,而非直接攻克最难题 [19] 行业反响与评价 - 谷歌DeepMind首席执行官Demis Hassabis公开评论此事“太尴尬了” [1][3] - 图灵奖得主Yann LeCun在社交媒体上嘲讽此举是“搬起石头砸自己的脚” [5] - 研究人员明确表示其原意并非宣称GPT-5破解难题,而是通过数千条查询找到了十个问题的解 [6] 对AI科研的启示 - 开发者强调必须谨慎对待任何关于人工智能发现新科学或数学成果的说法 [15] - 行业观点认为,关于人工智能的科学发现需要更多的同行评审 [17] - 尽管需要对人工智能的原创发现保持审慎,但人工智能辅助科研被视为未来的必经之路 [20]
MIT爆火论文被曝数据造假!曾验证AI辅助科研增速44%,诺奖得主都被诓了
量子位· 2025-05-21 04:33
论文核心事件与影响 - 一篇宣称AI显著提升科研生产力的预印本论文因涉嫌关键实验数据造假,被麻省理工学院(MIT)责令撤稿[1][3] - 该论文曾引起学术圈广泛关注,被部分学者称为“AI对科学发现影响的最佳论文”,并获诺奖得主点赞[1][21] - MIT校方正式声明,对该论文数据的来源、可靠性及有效性缺乏信心,并强调论文应从公共讨论中撤回[4][5] 论文原主张的核心研究发现 - 研究通过在一家大型企业研发实验室对1018名科学家进行随机对照试验,评估AI材料发现技术的影响[9][10] - 使用AI辅助后,新材料发现量增加44%,专利申请量增加39%,下游产品创新提升17%[2] - AI自动化了57%的“创意生成”任务,使科学家能将更多时间转向评估AI建议[14] - AI的影响存在异质性:高能力科学家的产出增长81%,而底层三分之一科学家受益甚微[14] - 尽管产出提升,但82%的科学家报告工作满意度降低,主要原因为技能未充分利用和创造性减少[14] 学术调查与后续处理 - MIT纪律委员会于2025年2月初收到针对该论文的指控后启动秘密内部审查[34][35] - 指控最初由一位具备材料科学背景的计算机科学家向论文致谢中的两位教授提出,随后被提交至校方[35] - 尽管论文仍为预印本,但校方担忧其会对关于AI工具影响的学术及公共讨论产生误导[36] - 论文作者已离开MIT,且截至声明发布时,尚未配合校方敦促其在arXiv平台提交撤稿请求[6][38]