Gemini DeepResearch - 财报，业绩电话会，研报，新闻

Gemini DeepResearch

搜索文档

36氪· 2026-01-12 09:49

文章核心观点 - 陶哲轩澄清AI解决数学问题的能力被夸大，旨在纠正将AI产出可验证结果等同于AI具备独立数学创新和替代人类能力的叙事[1][2] - AI在数学研究中的实际角色是工具链的一环，擅长执行体力活和工程活，但数学的灵魂如提出深刻问题、创造新概念等仍高度依赖人类[6][12] AI在Erdős问题上的贡献与案例 - AI在特定Erdős问题上生成了完整或部分解答，例如问题728在2026年1月6日由Aristotle与ChatGPT 5.2 Pro给出完整解答并通过Lean验证，问题729在2026年1月8日至10日也获得完整解答并使用了对728解法的修改版本[8][9] - AI被用于文献检索，以核查问题是否已被解决，例如GPT-5在2025年10月13日对问题[35]、[66]等进行了审核并找到了部分结果，在2025年11月2日对问题[94]找到了完整解法[11] - 存在AI完全解决问题后才发现已有文献解法的案例，例如问题[333]在2025年12月25日由ChatGPT 5.2 Pro和Claude Opus 4.5给出完整解决方案，但结果与Erdős和Newman (1977)的工作相似[10] 评估AI数学进展需考量的多维因素 - Erdős问题难度跨度极大，包含大量研究很少的“长尾题”和超级硬核的核心难题，仅比较“解题数”可能不是同一难度段的对比[2] - 许多问题“是否未解”本身不确定，网站标签“Open”往往是暂定的，AI解出后常发现文献早有解法，这使得“AI首解”的叙事容易翻车[3] - AI生成的证明常缺少背景、动机、文献对比等知识网络连接，其数学价值可能低于人类证明，且解出冷门题不等于够格投顶级期刊[3] - 将AI证明形式化到Lean等证明助手中虽提高可信度，但仍可能因引入额外公理、误形式化问题陈述或利用数学库的“边角行为”而被钻空子[4] AI在数学研究中的实际定位与未来展望 - AI当前擅长数学的体力活和工程活，如跑套路、补漏洞、做形式化、写稿改稿、查文献[12] - 数学的真正“灵魂”——提出深刻问题、创造新概念、将结果嵌入学科知识网络——仍然高度依赖人类[12] - 未来数学家可能扮演统领硅基智能大军的指挥官角色，由人类指引方向，AI负责开路架桥[12]