统计学
搜索文档
统计学最高荣誉回归华人!苏炜杰:AI需要一门新的数学语言
量子位· 2026-03-12 17:37
苏炜杰教授获奖与核心研究贡献 - 宾夕法尼亚大学苏炜杰教授于2026年荣获统计学界最高荣誉考普斯会长奖,这是时隔14年后该奖项再次由华人学者获得 [1][2] - 其获奖基于在AI可信部署、隐私保护及AI学术评审机制等多个方向的突破性贡献 [1][7] - 苏教授坚信在AI时代,统计学将扮演越来越重要的角色,因其能通过概率分布为复杂黑盒系统找到最优解 [4][6] AI可信部署与稳健性研究 - 将AI生成内容的可追溯性、人类偏好对齐等问题形式化为严谨的统计框架,为AI应用提供理论支撑 [9] - 提出“剥洋葱”式研究思路,将神经网络视为多层结构,无需完全理解内部机制,可通过逐层分析并结合行为表现来优化和控制风险 [58][59][62] - 在偏好对齐工作中,将Transformer视为黑盒概率输出器,通过设计损失函数引导概率分布趋向目标,无需理解其内部结构 [57] 隐私保护的前沿观点与框架 - 提出高斯差分隐私框架,该框架已应用于2020年美国十年一次的人口普查,提升了隐私数据的效用 [9] - 指出在神经网络时代,由于训练数据与模型输出关系难以刻画,传统差分隐私理论面临挑战,常需添加过大噪音导致模型能力下降 [65][67] - 建议设计类似区块链的激励结构,将隐私保护从外部要求转化为公司追求自身利益最大化的内生动力 [72][73][74] - 主张采用更分层、分级的隐私目标,而非一刀切,并在社会层面持续强调隐私的重要性 [70][71] AI对齐、偏好聚合与社会影响 - 指出人类偏好不存在唯一最优解,但需明确底线,即“哪些偏好我们绝对不想要”,避免AI收敛到有害的均衡点 [19][30][33] - 现有基于奖励模型和强化学习的对齐方案,其简单的统计模型可能无法完美表达复杂、有时存在循环(如投票悖论)的真实人类偏好 [29][30] - AI由人类数据训练而来,会继承人类偏好,同时其价值观也在反向影响年轻用户,形成了一个双向塑造的过程 [28] - AI对社会整体结构的影响和演化,更接近经济学的研究范畴,需要从更宏观的视角进行审视 [26][27] AI可解释性的根本挑战与替代路径 - 认为将AI彻底“白盒化”极不现实,因为人类连自身大脑都未完全理解,理解更复杂且不断增长的“硅基大脑”难度更大 [5][53] - 模型能力(Scaling)的增强往往以可解释性减弱为代价,因为AI的发展目标并非可解释性本身 [52] - 可解释性研究可能需要重新定义“理解”的概念,未来可在“有限黑盒”条件下,结合机制证据与行为表现寻找平衡方案 [49][62] AI学术生态与评审机制 - 提出并推动了一项AI学术评审新机制:要求作者对自己的多篇投稿进行质量排序,该机制已于2026年在ICML会议上正式投入使用 [9][20] - 指出当前学术审稿存在滑向低质量均衡的风险:因投稿量激增、审稿人疲劳,导致审稿质量下降的恶性循环 [34] - 认为AI审稿在“信息抓取”类任务上优于人类,但若普遍使用少数几个主流AI,将导致审稿意见缺乏多样性,失去其核心价值 [36][39][40] - 对AI生成学术论文中的“幻觉”问题发出严重警告,虚假引用一旦进入知识体系并被多次引用,将对人类知识传承造成巨大危害 [42][43][44] 对AI理论发展的根本性判断 - 提出一个核心论断:AI需要一套全新的数学语言,因为现有数学体系(伴随物理学发展而来)可能从根本上就不适合描述AI [12][83] - 将AI类比为一种“新的物理”,但其结构与经典物理相反:物理学是“从小到大”(从底层机制推导宏观行为),而AI是“从大到小”(先定宏观框架,再训练确定参数) [13][82] - 呼吁更多受过纯数学训练的人才进入AI领域,共同创造一套更优美、更适合AI的数学框架,其意义不亚于经典力学或相对论的创立 [14][15][84][85] AI时代的教育与人才培养 - 认为大学教育体系依然重要,其中的老师指导和考试反馈机制有助于打牢基础,这是完全自学或仅靠AI对话难以替代的 [19][96][97] - 指出AI领域“结果至上”,独立研究者可能在GitHub上做出有影响力的项目,但其成果有时错误较多、质量波动大,凸显了系统训练和反馈机制的价值 [91][94][95] - 建议学生主动学习、积极利用AI进行探索和创造,因为在AI时代,被动学习与主动探索者之间的能力差距可能会被拉大到数个数量级 [108][109] - 对于高等教育路径,建议美国学生先完成学业,而国内学生若准备充分也可勇敢尝试,同时指出大厂内部的算力资源也并非无限 [100][99][101] 跨学科思维与AI研究 - 苏教授的经济学双学位背景(源于偶然)为其提供了关键思维方式:认识到真实世界是混沌的,许多问题只能近似描述,终极理性可能并不存在 [22][24] - 这种经济学思维使其更关注“人”的共同体以及社会结构,从而将AI对齐问题置于更广阔的人类社会互动背景中进行研究 [25][26] - 强调在AI这样由数千万人参与的宏大系统中,计算机、数学、经济学等不同背景的参与者从各自角度推进,没有孰优孰劣之分 [77] AI工具的应用与学术界前景 - 苏教授本人在研究工作中深度使用AI,将其视为“随身合作者”,在思路形成早期即进行交流,AI的反馈有时甚至会改变其原有研究方向 [102][103] - 认为当前学术界人才流向产业界可能是短期现象,随着Scaling Law边际收益下降,业界将更关注如何在资源受限下提升效率,而这正是学术界擅长的范式 [104][105] - 指出现有的大学培养模式大多不适合AI时代,导致学生就业受冲击,并引用陶哲轩的观点,认为数学等学科的教学方式两百年未变,AI将迫使这一局面改变 [105][106][107]
时隔14年,再次花落中国!
新浪财经· 2026-02-06 22:25
行业地位与奖项 - 国际统计学会会长委员会宣布,2026年考普斯会长奖授予中国学者苏炜杰[1] - 这是中国学者时隔14年再次获得该奖项[3] - 该奖项由国际数理统计学会、美国统计学会、国际生物统计学会以及加拿大统计学会联合颁发,每年在全球范围内评选一位40岁及以下的杰出学者[3] - 其学术地位通常被类比为统计学界的“诺贝尔奖”或基础数学领域的“菲尔兹”奖[3] 获奖者贡献 - 苏炜杰的获奖工作涵盖人工智能大模型统计理论、隐私数据保护分析、改进机器学习同行评审、凸优化加速算法理论以及深度学习数学理论与高维统计推断[1] - 获奖者表示,统计学正从传统的数据分析工具,演变为支撑人工智能系统可信性、可解释性与安全性的核心理论基础[3] - 统计学在大模型不确定性的定量刻画、算法偏差与公平性评估,以及数据隐私与安全保护方面发挥着重要作用[3] - 此次获奖是对统计与数据科学在人工智能时代基础性地位的进一步肯定[3]
重磅!中国学者斩获统计学界“诺贝尔奖”
环球网资讯· 2026-02-06 15:19
奖项与荣誉 - 中国学者苏炜杰荣获2026年考普斯会长奖 这是中国学者时隔14年再次获得该奖项 [1][3] - 考普斯会长奖每年在全球范围内评选一位40岁及以下 在统计与数据科学领域作出原创性 奠基性贡献并产生深远影响的学者 其学术地位在统计学界通常被类比为基础数学领域的“菲尔兹”奖 [3] - 苏炜杰此前曾获斯隆研究奖 工业与应用数学学会数据科学青年奖等国际奖项 并于2025年当选国际数理统计学会会士 [4] 学术贡献与研究领域 - 获奖表彰其在人工智能大模型统计理论 隐私数据保护分析 改进机器学习同行评审 凸优化加速算法理论以及深度学习数学理论与高维统计推断等方面的工作 [1] - 其研究长期横跨统计 优化与机器学习多个领域 近年来研究重点集中在大模型与生成式人工智能的统计与优化理论 围绕模型对齐 统计水印以及神经网络优化器的行为机制 提出了系统性的理论分析框架 [4] - 苏炜杰表示 在人工智能时代 统计学正演变为支撑人工智能系统可信性 可解释性与安全性的核心理论基础 此次获奖是对统计与数据科学在人工智能时代基础性地位的进一步肯定 [3] 背景与影响 - 苏炜杰现任职于宾夕法尼亚大学沃顿商学院统计与数据科学系 并在数学系和计算机系兼任教职 [4] - 苏炜杰2011年毕业于北京大学数学科学学院 2016年从斯坦福大学获得统计学博士学位 [4] - 北京大学数学科学学院2007级被广泛称为“黄金二代” 苏炜杰此次获奖被视为该群体在应用数学与统计方向补上的重要一块拼图 [4] - 统计学是华人学者在国际学术界具有显著优势和影响力的学科之一 [4]
专访迈克尔·乔丹:不要把像我这样的人视为“特例”
新浪财经· 2026-01-08 09:25
迈克尔·欧文·乔丹的学术与产业背景 - 迈克尔·欧文·乔丹是机器学习领域的先驱,现任加州大学伯克利分校电子工程与计算机科学系、统计学系杰出冠名教授,同时是北京大学、清华大学名誉教授 [1][17] - 他拥有多项顶级荣誉,包括首届世界顶尖科学家协会奖、约翰·冯·诺依曼奖,并当选美国国家科学院、工程院、艺术与科学学院三院院士,于2025年11月当选中国科学院外籍院士 [1][17] - 深耕机器学习与统计推理领域40余年,本科学习心理学,对大脑工作的思考引导其转向算法探索 [1][17] 产业合作与商业成就 - 在过去30年里,参与了三家公司的工作,其中两家是估值超过十亿美元的独角兽企业 [9][24] - 在中国担任蚂蚁集团科学顾问委员会主席,其想法影响了支付宝从支付系统发展为包含商家和消费者的市场建设系统 [9][24] - 曾担任支付宝、亚马逊的科学顾问,与产业界建立了广泛的合作 [1][17] 学术研究与实际应用 - 强调在纯理论研究与实际应用之间“横跳”,始终致力于寻找新问题并以简洁有趣的方式解决 [6][21] - 认为机器学习与统计学密不可分,“学习”本质上是基于统计方法进行分析的统计学问题 [7][21] - 指出大多数大语言模型背后的机制由学术研究人员开发,产业发展来源于学术研究,两者不存在脱节 [10][25] 对中国人工智能领域的观察 - 认为中国在最新一波大语言模型浪潮中更注重开源模式,这与20年前相比是彻底的转变,填补了空白 [11][27] - 指出中国有时更关注奖项、分数、文章数量,而非影响力、创造力和新想法,年轻教授面临发表文章等多重压力 [11][27] - 建议中国需要进一步培养解决真正问题的技能,并肯定了中国学生的创业精神、创造力和雄心壮志 [11][27][29] 对教育与人才培养的观点 - 鼓励青年带着好奇心,运用数学思想去做全新的事情,而非仅仅追求赢得奖项或解决历史难题 [12][14][28] - 建议在扎实的数学教育基础上,增加跨学科内容,例如其在伯克利开设融合统计学、计算机科学和微观经济学的新课 [14][28] - 强调合作与互动的重要性,鼓励多尝试并经历失败,认为通过持续努力(如花10年时间)任何人都能取得成就 [3][15][18][29]
为什么你很努力,却依然平庸?别赖运气,你只是用错了统计学
36氪· 2025-09-07 08:04
核心观点 - 帕累托分布揭示资源分配的不均衡性 少数关键因素(20%)贡献主要结果(80%)[7][10][12] - 成功策略需聚焦关键少数领域 而非平均分配资源 以实现超额回报[10][15][22] 资源分配策略 - 个性化营销效率远超大众营销 几十封定制邮件比数千封群发邮件创造更高收入[11] - 90%收入来自10%客户 99%互联网流量流向1%网站 体现极端集中效应[12] - 早期客户属于关键1%群体 应优先投入资源 其价值远超普通客户[14][15] 社交与关系管理 - 深度社交优于广度社交 与行业10位关键人物共进午餐的价值超过1000次随机广告点击[13] - 稳定社交关系上限约150人(邓巴数) 需聚焦4-5位能提供实质帮助的核心人脉[18][19][20] - 业务应对少数客户具备不可或缺性 而非对多数客户仅属锦上添花[16][17] 成功机制本质 - 非常规资源分配创造超额回报 聪明的小规模行动可产生10倍至1000倍回报[22] - 关键机会与人脉集中在分布极端区域 此处努力与结果呈非线性关系[23][24][25] - 旁观者视为"运气"的现象实为对帕累托分布的主动运用[1][25]
上帝会掷骰子吗? ——读《女士品茶:统计学如何变革科学和生活》
上海证券报· 2025-08-11 01:40
统计学发展历程 - 以20世纪英国剑桥大学"女士品茶"实验为切入点 追溯统计学从方法论雏形到系统学科的发展历程 [7] - 19世纪科学界盛行"机械宇宙"观念 认为现实世界可通过少量数学公式精准描述 观测偏差归因于仪器不精确 [8] - 卡尔·皮尔逊提出统计模型思想 使用平均数 标准差 对称性 峰度四参数描述观测值概率分布 [9] - 戈塞特针对小样本问题提出"t检验"方法 仅需标准差与均值的比值即可确定分布 [9] 统计方法创新 - 费希尔在农业实验中提出"方差分析"和"随机化控制"方法 通过科学实验分离不同处理方式的影响因素 [11] - 费希尔提出"最大似然函数方法"以最小化参数估计误差 与皮尔逊的统计分布理论形成分歧 [11] - 贝叶斯"逆概率"理论应用于作者溯源 通过词频分布参数和超参数分析文本风格 [12] - 威尔科克森提出非参数统计方法 处理含异常值数据 衍生出自举法 重采样等技术 [13] 假设检验与应用 - 费希尔引入假设检验概念 以P值作为显著性指标 但未明确解释其具体含义和判断标准 [14] - 内曼完善假设检验理论 确立零假设和备择假设框架 P值用于检验零假设强度 [14] - 统计学在20世纪广泛应用于政府机构(如FDA EPA)和医学 法律等领域 [14] - 流行病学研究采用回顾性和前瞻性方法 但现实数据缺陷增加了因果关系证明难度 [16] 统计学哲学思考 - 统计学面临三大哲学问题:统计模型的决策制定功能 现实生活中的概率含义 人类对概率的理解程度 [15] - 爱因斯坦"上帝不掷骰子"观点与统计学揭示的世界不确定性形成对比 但统计学自身存在P值意义等基础问题 [17] - 统计学发展汇聚了柯尔莫哥洛夫 图基等男性学者及考克斯 诺伍德等女性科学家的贡献 [16]
人工智能时代统计学将绽放异彩
科技日报· 2025-07-15 08:59
统计学在人工智能时代的应用 - 统计学广泛应用于商业、医学、工程、社会科学等领域,数据科学即"统计学+应用场景" [1] - 人工智能面临算法模型可解释性不足、框架安全漏洞、数据标注不规范等挑战 [1] - 统计学可从数据不确定性中归纳稳定、可解释的算法,提升模型可靠性 [2] 统计学与人工智能的融合 - 人工智能应用偏工程化,需统计学确保算法在医学、建筑工程等领域的稳定性 [1] - 人类仍需掌握程序运行逻辑,统计学在纠错和问题定义中发挥关键作用 [2] - 近25%的学术报告主题涉及机器学习与人工智能,显示学科交叉趋势 [1] 统计学人才培养与发展 - 统计与数据科学专业供不应求,需提升高校培养能力并留住人才 [2] - 中国作者在国际顶级统计期刊的发表份额位居世界第二,学科发展迅速 [2] - 全国统计与数据科学联合会议国际化显著,15%参会学者来自国外 [2] 行业活动与产学研合作 - 第三届全国统计与数据科学联合会议吸引21国专家,举办600多场学术报告 [1] - 组委会计划加强工业界联系,推动学科与应用创新融合 [2]