Workflow
Grokking
icon
搜索文档
KAN作者刘子鸣:AI还没等到它的「牛顿」
机器之心· 2026-01-02 13:00
AI研究范式与现状 - 行业当前处于AI研究的“第谷时代”,即拥有海量实验数据和强大模型,但缺乏对底层现象的系统性梳理与理论总结[1] - 行业为追求短期性能指标而跳过了“理解”这一关键步骤,正在积累高昂的“认知债务”[3][8] - 即便在“观察”层面,行业目前也极其原始,大多仅关注少数几个基于性能的指标调优[8] 学术发表机制的制约 - 当前学术发表机制偏爱“完美的故事”或“巨大的性能提升”,导致大量碎片化但极具价值的“AI现象学”工作被忽视[5] - 明星数据科学家Jeremy Howard指出,“实验性观察”几乎无法在AI/ML期刊和会议上发表,这阻碍了领域发展[6] - 能够被包装成“故事”的现象极其稀少,许多有趣的现象因无法整理成论文而被随意丢弃[14] AI现象学发展的困境 - 可发表的工作通常只有两类:在性能上有显著提升的工作,或拥有一个足够吸引人的“故事”[12] - 所谓“好故事”通常需要满足普适性或惊奇性,这两类要求都极高,抑制了现象学的发展[13][15] - 行业对“AI物理学”现象学提出了过高的期望,但其本身仍处于非常早期的阶段[9][13] 倡导的新研究范式 - 呼吁建立一种“平易近人的现象学”,不以即时应用为导向,回归用玩具模型进行可控、多视角的假设驱动探索[5][21] - 该方法强调可控性、多视角刻画以及好奇心或假设驱动的探索,定性结果已足够,定量结果更好[21] - 这种“可接近的现象学”对于社区建设具有极高价值,能促进不同研究者之间的观察联系、理论统一与算法改进[17] 个人与社区的行动计划 - 作者宣布将通过博客分享“半成品”的实验笔记,以记录观察、吸引志同道合者,并为课程准备材料[5][19][22] - 计划在清华大学开设一门《Physics of AI》课程,相关博客文章及配套代码可能成为课程材料[5][22] - 建议研究者从自己真正关心的问题开始,定义简单的玩具模型,并致力于彻底理解该模型[20][22]