研究背景与核心发现 - 清华大学李勇团队的研究通过分析全球2.5亿篇科学文献,揭示了AI for Science领域的一个核心矛盾:AI在助力科学家个体加速的同时,导致了科学界集体注意力的窄化和趋同优化,即“群体登山”现象[3] - 研究核心观点是,虽然AI帮助科学家发表了更多论文、更早成为项目负责人,但却使研究者集体涌入少量适合AI研究的“热门山峰”,从而削弱了科学探索的广度[4] - 这一矛盾被证实并非偶然,而是由当前科学智能AI模型缺乏通用性所导致的系统性影响[5] 研究动机与方法论 - 研究团队旨在探究一个明显矛盾:在AI持续赋能科研的背景下,为何各学科的整体科学进展未见明显加速[7] - 团队发表了题为《Artificial Intelligence Tools Expand Scientists' Impact but Contract Science's Focus》的论文,旨在评估AI工具对科学家和科学整体的影响[9][10] - 研究首项关键工作是识别“AI赋能的研究”,为此采用了“高质量专家标注 + 大规模语言模型推理”相结合的技术路径,使用BERT模型进行识别,其F1-score达到0.875[10][12][13] - 团队构建了一个基准数据集,涵盖1980-2025年间的4130万篇论文和2857万研究者,横跨机器学习、深度学习和生成式AI三个时代[14] 分析方法与指标 - 研究采用基于隐藏变量的科学学分析方法,深入到论文的“思想”和“内容”本身,以更精细地度量“知识广度”[17] - 方法将每篇论文的标题和摘要通过深度嵌入表征模型转换为一个768维的数学向量,作为论文在高维空间中的“坐标”[17][18] - 主要通过“直径”和“熵值”两个指标来测量知识广度:“直径”衡量探索的最远边界,“熵值”衡量坐标点在空间中分布的均匀度[19][21][23] - 使用这些指标分别测量使用AI与不使用AI的科学家群体的论文,以判断AI对科学认知边界的影响[24][25] 研究发现:个体加速与集体窄化 - 在微观个体层面,使用AI的科学家比不使用的科学家多发表3.02倍论文,获得4.84倍引用量,并且提早1.37年成为研究项目负责人(以末位作者为标志)[26][27] - 在集体层面,与AI结合的科研项目的知识广度下降了4.63%,不同领域科学家间的跨界互动减少了22%[29] - AI论文的引用呈现“星型结构”,几乎都集中在引用同一篇或少数几篇经典的、开创性的AI工作,表明研究趋向集中和单一化,缺乏创新活力[29] 矛盾根源与解决方案 - 研究指出,矛盾根源在于当前AI for Science模型缺乏通用性,产生了强大的“科学智能引力”效应,引导研究者集体涌向少量适合AI快速出成果的“热门山峰”[31] - 这种“群体登山”模式固化了科学探索路径,系统性地削弱了向“未知山峰”探索的广度,形成了“广度让位于速度”的现象[32][33] - 为突破局限,研究团队推出了全流程、跨学科的科研智能体系统——OmniScientist,旨在通过挖掘大模型智能体的通用推理能力,实现系统性科研支持,让AI从“辅助工具”进化为具备主动提出假说、自主设计实验等能力的“AI科学家”[36]
清华新研究,Nature+Science双杀!
量子位·2026-01-15 09:23