Workflow
AI辅助科研
icon
搜索文档
像挖币一样挖激活函数?DeepMind搭建「算力矿场」,暴力搜出下一代ReLU
机器之心· 2026-02-07 12:09
核心观点 - 谷歌DeepMind利用其开发的AlphaEvolve系统,在无限的Python函数空间中自动搜索并发现了全新的神经网络激活函数,这些函数在分布外泛化能力上超越了ReLU和GELU等现有标准函数,标志着AI设计AI的方法论革新 [2][4] 研究方法论革新 - 核心工具是AlphaEvolve,一个由LLM驱动的进化编码系统,它直接编写和修改Python代码来探索激活函数,突破了传统神经架构搜索受限于预定义数学算子的限制 [8][11] - 采用“微型实验室”策略,使用专门设计的合成数据来优化分布外泛化能力,避免了在ImageNet等大型数据集上进行昂贵搜索,实现了用小数据撬动大智慧 [4][14][40] - 系统的适应度函数基于分布外测试数据的验证损失,迫使模型学习举一反三,从而捕捉更本质的归纳偏置 [17][18] 新发现的激活函数及其特性 - 发现表现最佳的激活函数普遍遵循“标准激活函数+周期性扰动项”的通用公式,例如GELUSine和GELU-Sinc-Perturbation [25] - **GELUSine**:在GELU基础上增加了正弦项,引入周期性“摆动”以帮助优化过程逃离局部极小值 [26] - **GELU-Sinc-Perturbation**:公式为 `GELU(x) * (1 + 0.5 * sinc(x))`,在保留GELU渐近行为的同时,在原点附近引入了受控的非线性复杂性 [26][27] - **GMTU (Gaussian-Modulated Tangent Unit)**:结合了Tanh、高斯衰减和线性泄漏项,形状类似调制波,但计算成本较高 [28] - **湍流激活函数 (Turbulent)**:在合成数据上测试损失极低(29.8 ×10⁻³),但严重过拟合,迁移到真实任务时表现不佳,凸显了逐点激活函数的鲁棒性价值 [21][29] 在真实任务上的性能表现 - **在算法推理任务(CLRS-30)上表现出色**:GELU-Sinc-Perturbation取得了0.887的测试分数,显著优于ReLU的0.862和GELU的0.874 [34][36] - **在标准视觉任务上保持竞争力**:在ImageNet上,GELUSine和GELU-Sinc-Perturbation的Top-1准确率约74.5%,与GELU持平并远超ReLU的73.5% [34][36] - **周期性扰动的有效性**:周期性函数允许模型在训练域内“存储”频率信息,并在外推时通过周期性结构“检索”,这被认为是一种隐式的频率分析,有助于捕捉数据的复杂结构 [35] 对行业与AI研发的启示 - **代码即搜索空间**:利用LLM直接编写代码作为搜索空间,比预定义数学算子更灵活强大,LLM生成的函数甚至能提供人类可读的设计思路解释 [39] - **设计目标从拟合转向泛化**:激活函数的设计不仅为了优化梯度流动,其形状直接影响模型的归纳偏置,引入周期性结构是为模型注入“世界规律循环往复”的偏置 [40] - **预示AI设计AI的未来**:这项研究表明,在神经网络最基础的组件层面仍有巨大创新空间,未来的AI模型其底层算子可能将由AI自己书写 [42]
数学界无视「30年漏洞」,GPT-5一眼看穿,陶哲轩:AI科研革命开始了
36氪· 2025-11-05 18:52
文章核心观点 - 新闻核心观点是GPT-5在数学研究领域展现出实质性应用价值,通过辅助生成形式化证明和发现反例,推动了科学进步 [6][13][22][24] GPT-5在数学证明中的应用 - 两位数学家利用GPT-5在Lean中生成形式化证明并成功验证,最终证明超过6000行代码,包含26个定义、169个引理和4个定理 [13][16] - 人类研究者需不断提供反馈以完善论证,过程耗时约一周,在普通笔记本电脑上代码验证耗时不足半分钟 [16] - 陶哲轩认可此次AI辅助证明,认为这是在研究论文中负责任地使用LLM输出的罕见用例,强调Lean形式化仅是对人类证明的补充 [14][17] GPT-5在发现反例和解决开放问题中的贡献 - 加州大学欧文分校数学教授Paata Ivanisvili与合作者请GPT-5 Pro在公开未解问题中寻找反例,GPT-5提出了一个关于带擦除的非交互相关蒸馏问题的反例 [18][19][21][22] - UCLA数学教授Ernest Ryu借助GPT-5 Pro解决了一个凸优化领域的开放问题,尽管模型约80%的证明尝试错误,但提出了多条新颖思路,整个工作耗时约12小时 [24][27][29] - GPT-5的具体贡献包括给出最终可行的证明思路与论证框架,并通过快速排除无效路线大幅加速探索进程 [29] 行业影响与未来展望 - 此次GPT-5的应用被视为理论计算机科学中AI的“星星之火”,以往大语言模型多用于文献检索或数值辅助,而此次真正生成了具体、有限且可验证的反例 [24] - 研究者认为,如果大语言模型的接口能与Lean深度整合并进行微调,许多人机协作证明的问题将大大缓解,体验会更加流畅自然 [16] - OpenAI科学家Sebastien Bubeck复现了类似场景,表明GPT-5可以证明有趣的数学结论,并能筛选不正确论点、识别新推理思路以及决定探索方向 [43][44]
GPT-5破解世纪难题,竟是上网抄来的,哈萨比斯:太尴尬了
36氪· 2025-10-21 10:26
事件概述 - OpenAI团队宣称其GPT-5 Pro模型在一个周末内解决了10个埃尔德什难题 [1] - 后续澄清表明,这10个难题早已被科学界解决,GPT-5仅是通过检索网络文献找到了现有答案 [3][10] - 该事件被行业人士评价为一场“闹剧”和“自导自演”,引发了广泛争议 [1][6] 技术能力与局限性 - GPT-5在此次事件中展现的是文献检索能力,而非独立解决未解数学难题的能力 [3][10] - 有观点认为,尽管存在争议,但GPT-5在高效完成文献检索方面表现依然出色 [18] - 行业专家指出,人工智能在数学领域更现实的作用是使用中等水平工具辅助处理研究中的琐碎工作,而非直接攻克最难题 [19] 行业反响与评价 - 谷歌DeepMind首席执行官Demis Hassabis公开评论此事“太尴尬了” [1][3] - 图灵奖得主Yann LeCun在社交媒体上嘲讽此举是“搬起石头砸自己的脚” [5] - 研究人员明确表示其原意并非宣称GPT-5破解难题,而是通过数千条查询找到了十个问题的解 [6] 对AI科研的启示 - 开发者强调必须谨慎对待任何关于人工智能发现新科学或数学成果的说法 [15] - 行业观点认为,关于人工智能的科学发现需要更多的同行评审 [17] - 尽管需要对人工智能的原创发现保持审慎,但人工智能辅助科研被视为未来的必经之路 [20]
MIT爆火论文被曝数据造假!曾验证AI辅助科研增速44%,诺奖得主都被诓了
量子位· 2025-05-21 04:33
论文核心事件与影响 - 一篇宣称AI显著提升科研生产力的预印本论文因涉嫌关键实验数据造假,被麻省理工学院(MIT)责令撤稿[1][3] - 该论文曾引起学术圈广泛关注,被部分学者称为“AI对科学发现影响的最佳论文”,并获诺奖得主点赞[1][21] - MIT校方正式声明,对该论文数据的来源、可靠性及有效性缺乏信心,并强调论文应从公共讨论中撤回[4][5] 论文原主张的核心研究发现 - 研究通过在一家大型企业研发实验室对1018名科学家进行随机对照试验,评估AI材料发现技术的影响[9][10] - 使用AI辅助后,新材料发现量增加44%,专利申请量增加39%,下游产品创新提升17%[2] - AI自动化了57%的“创意生成”任务,使科学家能将更多时间转向评估AI建议[14] - AI的影响存在异质性:高能力科学家的产出增长81%,而底层三分之一科学家受益甚微[14] - 尽管产出提升,但82%的科学家报告工作满意度降低,主要原因为技能未充分利用和创造性减少[14] 学术调查与后续处理 - MIT纪律委员会于2025年2月初收到针对该论文的指控后启动秘密内部审查[34][35] - 指控最初由一位具备材料科学背景的计算机科学家向论文致谢中的两位教授提出,随后被提交至校方[35] - 尽管论文仍为预印本,但校方担忧其会对关于AI工具影响的学术及公共讨论产生误导[36] - 论文作者已离开MIT,且截至声明发布时,尚未配合校方敦促其在arXiv平台提交撤稿请求[6][38]