人物动向 - 爆火神经网络架构KAN的第一作者刘子鸣,拟于2025年9月加入清华大学人工智能学院,担任助理教授 [1] - 其教职早前已敲定,首批博士生招生在2025年5月前已完成 [7] - 目前,刘子鸣在斯坦福大学从事博士后研究,合作导师是Andreas Tolias [19] 学术背景与研究方向 - 刘子鸣是武汉人,高中为竞赛生,2015年以全国第8名成绩入选物理国家集训队,保送至北京大学物理学院 [8][9] - 本科期间即关注物理学与机器学习的交叉领域,并在相关期刊和NeurIPS 2020等会议上发表一作文章 [9] - 本科毕业后赴麻省理工学院(MIT)攻读物理博士学位,师从物理学家Max Tegmark [9] - 其研究风格为好奇心与影响力驱动,理论与实验结合,专注于介于纯理论与纯应用之间的中间抽象层问题 [18] - 他目前每天更新的博客名为“physics of AI”,旨在用研究物理学的方式来研究AI,关注模型、数据与现象之间的关系 [20] KAN(Kolmogorov-Arnold Networks)概述 - KAN的初版论文于2024年4月发布,迅速成为学术界热议话题,其GitHub仓库在两三天内收获1.1k星星 [3] - 论文核心观点是KANs可作为多层感知机(MLPs)的有力替代方案,为改进当前重度依赖MLPs的深度学习模型提供新契机 [4] - KAN的初始灵感来源于Kolmogorov-Arnold数学定理,旨在打开神经网络的“黑盒”,提升可解释性 [9] - 该定理指出,任何定义在有界域上的多元连续函数,都能表示为有限个单变量连续函数的两层嵌套叠加形式 [10] - KAN的设计将复杂高维函数学习转化为一组单变量函数的学习,用可学习的单变量函数替代MLP边上的线性权重,从而提供MLP无法比拟的可解释性和交互性 [11][13] KAN的学术影响与后续发展 - 论文发布后引发强烈反响,截至报道时,Google Scholar显示KAN的引用量已超过3000次 [14] - 刘子鸣的Google Scholar总引用量为7364次,h指数为22,i10指数为29,其中KAN论文引用量为3021次 [15] - 2024年8月,刘子鸣与合作者发表了KAN 2.0,旨在进一步提高KAN的实用性和易用性 [15] - 2025年,其另一篇相关论文“Kolmogorov-Arnold networks meet science”在Phys. Rev. X上发表 [15] 研究理念与博客更新 - 刘子鸣认为研究关键在于积累“大量小见解”,而非依赖“少数大发现” [21] - 他将研究分为三个方向:Science for AI(原理来自数学)、Science of AI(澄清神经缩放定律等现象)、AI for Science(利用KAN发现科学问题中的符号公式) [21] - 自2025年12月31日起,他坚持每日更新博客,每天投入约2小时通过玩具模型探索神经网络的新发现,相信其中部分见解可能产生巨大影响 [24]
KAN一作刘子鸣回国任教,清华官网盖章认证了
量子位·2026-01-12 14:25