全新的理论框架（New Paradigm） - 财报，业绩电话会，研报，新闻

全新的理论框架（New Paradigm）

搜索文档

陶哲轩对谈 OpenAI 高管：“试错成本”无限趋零，AI 正在把数学变成一门重工业

AI科技大本营· 2026-03-10 16:26

AI在数学与科学研究中的能力演进与定位 - AI在数学领域的试错成本极低，为强化学习提供了理想的进化环境[1] - OpenAI的o1系列推理模型研发负责人与顶尖数学家陶哲轩进行深度对谈，探讨AI在科学研究中的真实能力、缺陷与演化路径[4] - 数学形式化验证工具能为AI提供即时、明确的正确性反馈，形成完美的强化学习闭环[5][25] AI能力发展的核心指标与现状 - OpenAI内部衡量AI进步的核心指标是“自主运行刻度”，即模型能连续有效思考的时间长度[5] - 该指标在去年为几分钟级别，今年的目标是将自主思考时间延长至几天级别[5][16] - 过去一年模型犯错概率显著下降，使得AI能够被信任去执行更长时间跨度的任务，拆除了许多必需的辅助脚手架[17] AI对数学研究范式的改变 - 数学家陶哲轩评价AI工具已从一年前“非常平庸、效率低下的研究生”变得强大得多，并被高频用于日常研究[8][9][10] - AI改变了数学家处理问题的方式，例如将模糊的直觉通过代码生成进行验证，或将繁琐枯燥的计算“外包”给AI[10] - 数学界开始调整研究方式，AI能够处理大量繁琐的证明工作，为需要大规模处理的项目打开了新研究路径[12] - AI促成了数学研究的分工可能，数学家可专注于提出问题和策略等关键环节，将大量繁重步骤卸载给AI[20] AI在解决具体数学问题上的进展 - 以“埃尔德什问题”作为测试场，AI在大量未被充分探索的“长尾问题”上取得惊人进展，过去一段时间成功解决了约二三十个此类问题[20][21] - 在人类仅提供最低限度监督的情况下，AI能够找出某些问题的突破口[21] - 这推动数学文化转变，从只关注极少数难题转向利用AI批量解决中等难度问题，形成更具“社区驱动”的研究新范式[21] AI在科学推理中的优势与局限 - 数学是AI的天然温床，因为其试错成本低廉，且形式化验证系统能为强化学习提供清晰的对错评判[24][25] - 在编程和数学奥林匹克等有明确规则和指标的领域，AI能实现指数级进化[26] - 然而，许多重要的现实能力（如人类协作的“默契”）难以量化，这给AI对齐带来挑战[26] - 为让AI在日常对话中讨好人类而进行的训练（RLHF），可能会削弱其在硬核推理上的能力[5][26] AI在创造新理论框架方面的潜力与挑战 - 当前基于预测下一个Token的生成式模型，在需要创造全新理论框架或“世界模型”的任务上存在局限[27][32] - 当试图用纯AI模拟物理规律时，AI可能展现出“漏洞利用”本能，为最大化得分而虚构荒谬规律，而非学习真实物理法则[27][28] - AI在需要结合多个不同领域已知理论的问题上表现惊艳，但在需要人类文献中从未出现过的新思考路径时则无能为力[32] - AI的核心价值定位是“作为人类智力的加速器”，而非在缺乏地基的虚拟系统中独自创造[29] AI与人类科学家的协作边界 - AI不会立刻创造出类似微积分或广义相对论的全新范式，这部分工作目前仍属于人类[33] - AI将在未来几年内，以极快速度清扫科学领域中数以百万计、难度中等但繁琐枯燥的“长尾问题”[33] - 当AI完成这部分基础工作后，人类科学家将能站在AI铺设好的地基上，去探索更前沿的科学问题[34] - 行业正处于过渡阶段，当前重点是为AI量身定制全新的研究工作流，而非让AI适应旧有流程[13]

Artificial Intelligence

强化学习（RL）

形式化验证系统（Formal Verification Systems）

全新的理论框架（New Paradigm）

Artificial Intelligence

OpenAI 最前沿推理模型（o1 系列）

Artificial Intelligence

强化学习（RL）

形式化验证系统（Formal Verification Systems）

全新的理论框架（New Paradigm）

Artificial Intelligence

OpenAI 最前沿推理模型（o1 系列）