KAN一作刘子鸣回国任教,清华官网盖章认证了
36氪·2026-01-12 16:02

文章核心观点 - 神经网络架构KAN的提出者刘子鸣将于2025年9月加入清华大学人工智能学院任助理教授,其研究聚焦于AI与科学的交叉领域,旨在通过KAN等工具提升神经网络的可解释性并推动科学发现 [1][13] 人物背景与职业动向 - 刘子鸣拟于2025年9月加入清华大学人工智能学院,担任助理教授 [1] - 其首批博士生招生已于2025年5月前完成 [4] - 刘子鸣本科毕业于北京大学物理学院,博士就读于麻省理工学院(MIT),师从物理学家Max Tegmark [5] - 目前他在斯坦福大学从事博士后研究,合作导师是Andreas Tolias [15] KAN技术概述与影响 - KAN(Kolmogorov-Arnold Networks)初版论文于2024年4月发布,被提出作为多层感知机(MLP)的有力替代方案,在准确性和可解释性上优于MLP [1] - KAN的设计灵感来源于Kolmogorov-Arnold定理,该定理指出任何有界域上的多元连续函数可表示为有限个单变量函数的两层嵌套叠加 [5] - KAN用可学习的单变量函数替代了MLP边上的线性权重,从而提供了更好的可解释性和交互性 [6][8] - 论文发布后反响强烈,其GitHub仓库在两三天内获得1.1k星星,截至新闻发布时,Google Scholar引用量已超过3000次 [1][8] - 2024年8月,团队发布了KAN 2.0,旨在进一步提高其实用性和易用性 [12] 研究方向与理念 - 刘子鸣将KAN解读为三个层面的AI+Science:Science for AI(原理来自数学)、Science of AI(澄清神经缩放定律现象)、AI for Science(发现科学问题中的符号公式) [13] - 其研究风格是好奇心与影响力驱动,追求兼具科学启发和长期影响力的研究,例如KAN [15] - 研究注重理论与实验结合,理论追求物理学的严格程度,实验用于阐释现象而非盲目追求SOTA(最先进水平) [15] - 研究问题通常介于纯理论与纯应用之间的中间抽象层,强调抽象的质量和对实践的实用性,并与具体科学领域的应用组合作 [15] - 他通过名为“physics of AI”的博客,以研究物理学的方式研究AI,关注模型、数据与现象的关系,并坚持每日更新 [16][18] - 其博客更新策略是每天投入约2小时,通过玩具模型积累“大量小见解”,以期其中部分能产生改变领域的巨大影响 [18]