科学发现缩放定律 - 财报，业绩电话会，研报，新闻

科学发现缩放定律

搜索文档

量子位· 2025-10-08 21:06

核心观点 - DeepScientist是首个具备完整科研能力、无需人工干预即可实现目标导向、持续迭代并超越人类最先进研究成果的AI科学家系统[1] - 该系统在多个前沿AI研究任务中展现出卓越性能，例如在两周内完成了相当于人类科学家三年的工作量，并实现了多项性能指标的显著提升[3][4][18] - 该技术标志着AI科研模式从“科研助理”到“首席科学家”的根本性变革，开启了人机协同的科研新范式[8][11][34] 系统性能与效率突破 - 在AI文本检测任务中，两周内实施和验证了超过1000种不同假设，取得了相当于人类三年的进展[3] - 在RAID数据集上实现了7.9%的AUROC提升（从0.800提升至0.863），并大幅降低推理延迟190%（从117ms降至60ms），超越了人类现有SOTA方案[4][20][21] - 在智能体失败归因任务中，其A2P方法在“算法生成”任务上取得47.46%的准确率，相较人类SOTA基线（16.67%）性能提升183.7%[21][23][24] - 在LLM推理加速任务中，吞吐量达到193.90 tokens/秒，相较人类SOTA方法（190.25 tokens/秒）提升1.9%[21] 核心技术机制 - 采用分层贝叶斯优化方法，将科学发现过程形式化为目标驱动的问题，旨在有限研究预算内最大化有价值的科学发现[12][27] - 基于多智能体协同策略，构建三层级评估循环，根据不断增长的“经验库”产出新假设并做出资源分配决策[14] - 系统具备主动识别前沿研究局限、提出新科学构想、自动编写代码执行实验、撰写科研论文等完整科研能力[15] 科研模式变革与行业影响 - 实现了从“随机发现”到“长期主动式探索”的角色转变，标志着AI正式涉足最具创造性的科学发现过程[8][11] - 当并行GPU资源从1枚扩展到16枚时，系统每周产出的前沿级科学发现数量从0项跃升至11项，呈现近乎理想的线性增长，预示着科研范式从“人力密集型”向“计算密集型”转变[31][33] - 研究团队将开源核心系统与全部实验日志，旨在推动全球科研社区的创新，加速AI Scientist发展[35] 公司背景与未来发展 - DeepScientist由西湖大学自然语言处理实验室（WestlakeNLP）发布，该实验室由张岳教授领导，专注于语言模型推理、泛化和通用人工智能研究[37] - 实验室已开放免费的DeepScientist服务申请，期待与科研社区共同建设更高效的科学发现新范式[36] - 未来展望为人机协同科研范式，人类角色将转向提出科学问题和设定方向，AI则作为“科学探索引擎”进行广泛探索[34][35]

创智突破：AI首次自主发现106个超越人类设计的神经网络架构

机器之心· 2025-07-24 14:50

文章核心观点 - AI系统ASI-Arch实现了从“自动化优化”到“自动化创新”的范式转变，标志着AI架构设计领域的“AlphaGo时刻”[15][16][19] - 该系统在完全自主的条件下发现了106个超越人类设计的神经网络架构，证明了科学发现可以遵循缩放定律，进入工业化量产时代[2][20] - 这一突破意味着科学研究正从“人力驱动”模式转向“算力驱动”模式，是认知能力的代际革命[10][48][49] 从数学金牌到科学发现：认知复杂度的代际跃迁 - 解决IMO数学竞赛题目属于封闭性问题求解，而科学发现是开放性的长期认知过程，需要提出原创问题、设计实验、形成假设等[1][4] - ASI-Arch系统基于大模型技术构建了高度自主的多智能体研究框架，能独立完成从问题识别到结果验证的完整科研流程[5] - 系统进行了1,773次独立实验，累计消耗超过20,000 GPU小时的计算资源，其研究规模和效率远超传统人类团队[7] 突破性成果：106个超越人类的创新架构 - AI自主发现的106个线性注意力架构在多个基准测试中性能显著超越Mamba2、Gated DeltaNet等人类设计的顶尖基线模型[2][7][12] - 系统展现出超越人类认知边界的创新能力，其设计理念和优化策略连领域顶级专家也未曾考虑过[12] - 这一成果类似于围棋界的“Move 37时刻”，证明了AI在科学创新领域的超人类潜力[13] 为什么说这是AI架构设计的“AlphaGo时刻” - 传统神经架构搜索技术是在人类预设空间内进行优化，而ASI-Arch能够自主提出全新假说、实现验证并超越人类范式[15][16][18] - 这实现了从“工具”到“研究伙伴”甚至“独立研究员”的角色转变，涉足以往人类独有的创造性科学发现过程[19] - 研究首次建立了“科学发现缩放定律”，发现速度和质量与计算资源投入呈稳定缩放关系，标志科研从人力密集型转向计算密集型[20] ASI-Arch超智能如何自主进行科学研究 - 系统核心是由研究员、工程师、分析师和认知库四个模块构成的闭环进化系统[24] - 研究员负责提出架构设想，工程师进行训练评估，分析师总结实验数据，认知库存储近百篇人类顶尖论文的核心知识[25][26][27][28] - 创新性地引入Fitness Function和LLM专家评审，综合评估性能指标和创新性，避免“奖励黑客”问题[29] 实验结果解读：AI“研究员”全面超越人类顶尖模型 - 在涵盖常识推理、阅读理解等12个基准测试的综合平均得分上，AI架构全面超越了Gated DeltaNet等人类基线模型[31][34][35] - AI架构在训练损失和困惑度指标上表现更优，表明其学习效率更高，对语言规律的把握更精准[36] - 106个新SOTA架构的集体涌现证明发现能力是系统性、可复现的，AI独立演化出了巧妙的门控机制与路径融合策略[37] AI“研究员”的设计哲学：涌现出怎样的智慧 - AI设计聚焦经典组件，如门控系统和卷积架构，通过对关键技术的精妙组合实现突破，而非盲目追求新颖性[39] - 顶尖模型的设计灵感有44.8%来源于对过往实验的自我反思，表明自我探索和总结能力是产出颠覆性成果的关键[41][42] - 系统展现出“设计纪律”，模型参数量分布稳定，拒绝通过暴力堆砌复杂度来提升性能的简单策略[43] 开源贡献：推动全球AI研究民主化 - 研究团队将全部106个突破性架构、完整系统框架及研究过程数据向全球开源，促进协同发展[45] - 这一举措标志着“AI for AI research”新时代的开启，AI成为研究主体，形成自我改进的正向循环[45]