凸优化
搜索文档
苏炜杰获2026「统计学诺奖」考普斯奖,14年来首位华人得主
机器之心· 2026-02-07 12:09
考普斯奖项与苏炜杰获奖 - 2026年考普斯奖(COPSS Presidents' Award)颁给了宾夕法尼亚大学副教授苏炜杰,这是时隔14年后再次有华人获得此奖项 [1][6] - 该奖项被誉为“统计学诺贝尔奖”或统计学界的菲尔兹奖,由五大顶级统计学会共同评选,每年仅授予一位40岁以下的统计学家 [4] - 奖项委员会评价苏炜杰的贡献包括:为大语言模型的多项应用建立严格的统计基础;在隐私保护数据分析方面取得突破性进展并应用于2020年美国人口普查;设计了AI顶级会议的同行评审机制;以及在凸优化、深度学习数学理论与高维统计推断方面作出广泛而深远的贡献 [2] 苏炜杰的学术背景与职业履历 - 苏炜杰现任宾夕法尼亚大学沃顿商学院统计与数据科学系副教授,同时在数学系、计算机系兼职,并担任宾大机器学习研究中心联合主任 [7] - 其教育经历:2007-2011年就读于北京大学数学科学学院基础数学专业,以年级第一毕业;2011-2016年在斯坦福大学攻读博士学位,师从美国国家科学院院士Emmanuel Candes [12][13] - 2016年博士毕业后,未经博士后阶段直接受聘于宾夕法尼亚大学沃顿商学院执教 [9][14] - 高中时期曾获中国数学奥林匹克竞赛银牌(高一)和金牌(高三),并因此保送北京大学 [11][12] 主要学术成就与研究领域 - **大模型的统计与优化理论基础**:其研究将大模型可信部署的关键问题形式化为严谨统计框架,发展了最优的水印检测假设检验方法,并提出了首个能完全保证人类偏好对齐的无偏正则化方案 [18] - **隐私保护机器学习的理论突破**:与其学生提出的高斯差分隐私(GDP)框架,实现了隐私保护与模型准确率的最优平衡,并成功应用于2020年美国人口普查——全球规模最大的差分隐私实践,研究表明在相同隐私保护水平下噪声方差可降低约15% [21] - **AI学术评审的机制设计**:提出的保序机制开创了“作者参与评审”的新范式,该机制要求作者对自己的多篇投稿进行质量排序,并严格证明了其激励相容性,已于2026年在国际顶级AI会议ICML正式投入使用 [23] - **凸优化加速算法的理论奠基**:其工作将离散凸优化加速算法纳入连续微分方程分析框架,系统性地在数值分析与最优化两大领域间建立深刻数学联系,该成果已成为教科书级经典,并被OpenAI研究员近期的突破性成果所引用 [25] - **深度学习理论的数学解释**:其团队提出的层间剥离模型为“神经坍缩”现象提供了严格数学证明,并从理论分析中预测出全新的“非均衡坍缩”现象 [27]
真·博士水平,GPT-5首次给出第四矩定理显式收敛率,数学教授只点拨了一下
36氪· 2025-09-10 17:32
核心观点 - GPT-5在数学研究领域展现出博士水平的辅助能力,成功将定性的第四矩定理扩展为带有显式收敛率的定量形式,并推广至泊松情形 [1][6][14] - 研究过程体现了人机协作的模式,研究人员通过精准提示和纠错引导GPT-5完成复杂的数学推导与论文撰写 [8][10][12] - 尽管GPT-5的贡献显著,但现行学术出版政策禁止将其列为论文共同作者 [18] 研究过程与方法 - 研究受GPT-5 Pro此前解决凸优化开放性问题(将边界值从1/L改进为1.5/L)的启发而展开 [6] - 三位数学教授在Malliavin–Stein框架下设计对照实验,初始目标是让GPT-5将定性第四矩定理推广为带有显式收敛率的定量形式,并涵盖高斯与泊松情形 [8] - 研究人员通过多轮提示、纠错和引导(例如检查并修正协方差公式推导错误)与GPT-5互动,最终使其完成正确推理 [10][11][16] - 为优化性能,在推广至泊松情形时,研究人员开启了新的对话并提供了相关论文作为参考思路 [14] 研究成果与输出 - GPT-5最终输出了完整的可投稿研究论文,包括引言、主要定理陈述、详细证明过程、参考文献以及应要求添加的“结论与展望”部分 [12] - 在结论中,GPT-5自行提出该方法可推广到非高斯框架中,研究人员据此成功将其扩展至泊松情形 [13][14] - 在泊松情形的推广中,GPT-5识别出与高斯情形的结构性差异,并在研究者引用具体公式(如(2.4))提示后,成功将非负性条件纳入并重新表述了定理 [15][16][17] 行业反响与影响 - OpenAI联合创始人Greg Brockman对此研究成果表示欣慰 [2] - 相关研究成果和过程通过社交媒体(如X和LinkedIn)及学术平台(arXiv)传播,引发了行业关注 [21]
真·博士水平!GPT-5首次给出第四矩定理显式收敛率,数学教授只点拨了一下
量子位· 2025-09-10 16:01
文章核心观点 - GPT-5在数学研究领域展现出博士水平的能力,能够协助研究人员完成复杂的数学定理证明和推广工作 [1][2] - 在数学教授引导下,GPT-5首次将定性的第四矩定理扩展为带有显式收敛率的定量形式 [1] - GPT-5 Pro上个月在数分钟内解决了凸优化领域的一个开放性问题,将已知边界值从1/L改进为1.5/L [8] - OpenAI联合创始人Greg Brockman对GPT-5的研究成果表示欣慰 [4] 研究实验过程 - 三位数学教授在Malliavin–Stein框架下开展对照实验,目标是将第四矩定理推广为定量形式并涵盖高斯与泊松情形 [9][10] - 研究人员从初始提示开始,要求GPT-5基于论文2502.03596v1推导定量版本 [11][12] - 第一次互动GPT-5给出总体正确结论但推理过程出现错误,经研究者指出后修正并给出正确推理 [13][14][15] - GPT-5最终将结果整理成可投稿的研究论文格式,包括引言、定理陈述、完整证明和参考文献 [17][18] 技术能力表现 - GPT-5能够识别泊松情形与高斯情形的结构性差异,提出混合期望不一定为零的重要观点 [24] - 在研究者具体指出论文1707.01889v2的公式(2.4)后,GPT-5能立即将非负性考虑进去并重新表述定理 [26][27][28] - GPT-5提出该方法可推广到非高斯框架中,展现出对研究方向的拓展能力 [20] - 研究人员因arXiv政策禁止AI列为作者,最终提交的作者列表中不含GPT-5 [29][30] 行业影响 - 该研究成果展示了AI在高端数学研究领域的实际应用潜力 [1][8] - GPT-5在专业数学问题解决和论文撰写方面表现出接近人类专家的水平 [17][18][19] - 研究过程显示AI需要人类专家的适当引导才能发挥最佳性能 [14][15][25]
GPT-5 Pro独立做数学研究!读论文后给出更精确边界,OpenAI总裁:这是生命迹象
量子位· 2025-08-21 12:23
核心观点 - AI模型GPT-5 Pro在阅读数学论文后能够独立推导出新的数学结论,展示了自主探索能力 [1][2][8] - 在凸优化问题中,GPT-5 Pro改进了原有论文的边界阈值,将步长边界从1/L提升到1.5/L [26][27] - 虽然人类研究者后续更新论文反超了GPT-5 Pro的结果,但AI的证明思路完全不同,表明其具备独立研究能力 [7][8][41] - OpenAI总裁将这一成果称为"生命迹象",突显AI自主思考的突破性 [9] 技术细节 凸优化问题研究 - 研究核心是梯度下降算法优化光滑凸函数时,优化曲线(f(x_n)随迭代次数n变化的曲线)的凸性问题 [10][11] - 关键发现包括: - 步长η ∈ (0, 1/L]时优化曲线保证是凸的 [17] - 步长η ∈ (1.75/L, 2/L)时优化曲线可能非凸 [17] - 整个收敛区间η ∈ (0, 2/L]内梯度范数序列总是单调递减 [17] - 二阶可导凸函数的梯度流优化曲线总是凸的 [17] 证明方法 - 原论文通过构造辅助函数g_k(t)将离散迭代转化为连续积分,利用凸函数性质证明优化曲线凸性 [14] - 非凸可能区间的证明通过构造特定分段函数反例实现,选择初始点x_0 = -1.8进行验证 [19] - GPT-5 Pro的创新在于: - 运用Bregman散度不等式和共强制性不等式进行更精细的代数操作 [30][31] - 通过不等式技巧将边界从1/L提升到1.5/L,耗时17分半 [27][28] - 证明思路与人类研究者后续更新论文的方法完全不同 [41] 人类研究者的更新 - 后续论文更新证明了1.75/L是精确界限,闭合了之前未探索的区间 [37] - 方法是对三个点对分别建立Bregman散度不等式,加权求和后化简梯度项组合 [37] - 通过不等式组合证明了f(x_2)-f(x_1) ≥ f(x_1)-f(x_0)的关系 [38][39][40] 社会影响 - 该研究成果引发广泛关注,相关推文在半天内获得230多万次阅读 [3] - 虽然GPT-5 Pro的结果最终被人类反超,但其独立证明能力被视为重要突破 [8][41] - 这一进展展示了AI在数学研究领域的潜在应用价值 [1][9]