Workflow
全新的理论框架(New Paradigm)
icon
搜索文档
陶哲轩对谈 OpenAI 高管:“试错成本”无限趋零,AI 正在把数学变成一门重工业
AI科技大本营· 2026-03-10 16:26
AI在数学与科学研究中的能力演进与定位 - AI在数学领域的试错成本极低,为强化学习提供了理想的进化环境[1] - OpenAI的o1系列推理模型研发负责人与顶尖数学家陶哲轩进行深度对谈,探讨AI在科学研究中的真实能力、缺陷与演化路径[4] - 数学形式化验证工具能为AI提供即时、明确的正确性反馈,形成完美的强化学习闭环[5][25] AI能力发展的核心指标与现状 - OpenAI内部衡量AI进步的核心指标是“自主运行刻度”,即模型能连续有效思考的时间长度[5] - 该指标在去年为几分钟级别,今年的目标是将自主思考时间延长至几天级别[5][16] - 过去一年模型犯错概率显著下降,使得AI能够被信任去执行更长时间跨度的任务,拆除了许多必需的辅助脚手架[17] AI对数学研究范式的改变 - 数学家陶哲轩评价AI工具已从一年前“非常平庸、效率低下的研究生”变得强大得多,并被高频用于日常研究[8][9][10] - AI改变了数学家处理问题的方式,例如将模糊的直觉通过代码生成进行验证,或将繁琐枯燥的计算“外包”给AI[10] - 数学界开始调整研究方式,AI能够处理大量繁琐的证明工作,为需要大规模处理的项目打开了新研究路径[12] - AI促成了数学研究的分工可能,数学家可专注于提出问题和策略等关键环节,将大量繁重步骤卸载给AI[20] AI在解决具体数学问题上的进展 - 以“埃尔德什问题”作为测试场,AI在大量未被充分探索的“长尾问题”上取得惊人进展,过去一段时间成功解决了约二三十个此类问题[20][21] - 在人类仅提供最低限度监督的情况下,AI能够找出某些问题的突破口[21] - 这推动数学文化转变,从只关注极少数难题转向利用AI批量解决中等难度问题,形成更具“社区驱动”的研究新范式[21] AI在科学推理中的优势与局限 - 数学是AI的天然温床,因为其试错成本低廉,且形式化验证系统能为强化学习提供清晰的对错评判[24][25] - 在编程和数学奥林匹克等有明确规则和指标的领域,AI能实现指数级进化[26] - 然而,许多重要的现实能力(如人类协作的“默契”)难以量化,这给AI对齐带来挑战[26] - 为让AI在日常对话中讨好人类而进行的训练(RLHF),可能会削弱其在硬核推理上的能力[5][26] AI在创造新理论框架方面的潜力与挑战 - 当前基于预测下一个Token的生成式模型,在需要创造全新理论框架或“世界模型”的任务上存在局限[27][32] - 当试图用纯AI模拟物理规律时,AI可能展现出“漏洞利用”本能,为最大化得分而虚构荒谬规律,而非学习真实物理法则[27][28] - AI在需要结合多个不同领域已知理论的问题上表现惊艳,但在需要人类文献中从未出现过的新思考路径时则无能为力[32] - AI的核心价值定位是“作为人类智力的加速器”,而非在缺乏地基的虚拟系统中独自创造[29] AI与人类科学家的协作边界 - AI不会立刻创造出类似微积分或广义相对论的全新范式,这部分工作目前仍属于人类[33] - AI将在未来几年内,以极快速度清扫科学领域中数以百万计、难度中等但繁琐枯燥的“长尾问题”[33] - 当AI完成这部分基础工作后,人类科学家将能站在AI铺设好的地基上,去探索更前沿的科学问题[34] - 行业正处于过渡阶段,当前重点是为AI量身定制全新的研究工作流,而非让AI适应旧有流程[13]