分层贝叶斯优化
搜索文档
首个全自动AI科学家诞生!西湖大学最新成果:性能超越人类SOTA基线183.7%
量子位· 2025-10-08 21:06
核心观点 - DeepScientist是首个具备完整科研能力、无需人工干预即可实现目标导向、持续迭代并超越人类最先进研究成果的AI科学家系统[1] - 该系统在多个前沿AI研究任务中展现出卓越性能,例如在两周内完成了相当于人类科学家三年的工作量,并实现了多项性能指标的显著提升[3][4][18] - 该技术标志着AI科研模式从“科研助理”到“首席科学家”的根本性变革,开启了人机协同的科研新范式[8][11][34] 系统性能与效率突破 - 在AI文本检测任务中,两周内实施和验证了超过1000种不同假设,取得了相当于人类三年的进展[3] - 在RAID数据集上实现了7.9%的AUROC提升(从0.800提升至0.863),并大幅降低推理延迟190%(从117ms降至60ms),超越了人类现有SOTA方案[4][20][21] - 在智能体失败归因任务中,其A2P方法在“算法生成”任务上取得47.46%的准确率,相较人类SOTA基线(16.67%)性能提升183.7%[21][23][24] - 在LLM推理加速任务中,吞吐量达到193.90 tokens/秒,相较人类SOTA方法(190.25 tokens/秒)提升1.9%[21] 核心技术机制 - 采用分层贝叶斯优化方法,将科学发现过程形式化为目标驱动的问题,旨在有限研究预算内最大化有价值的科学发现[12][27] - 基于多智能体协同策略,构建三层级评估循环,根据不断增长的“经验库”产出新假设并做出资源分配决策[14] - 系统具备主动识别前沿研究局限、提出新科学构想、自动编写代码执行实验、撰写科研论文等完整科研能力[15] 科研模式变革与行业影响 - 实现了从“随机发现”到“长期主动式探索”的角色转变,标志着AI正式涉足最具创造性的科学发现过程[8][11] - 当并行GPU资源从1枚扩展到16枚时,系统每周产出的前沿级科学发现数量从0项跃升至11项,呈现近乎理想的线性增长,预示着科研范式从“人力密集型”向“计算密集型”转变[31][33] - 研究团队将开源核心系统与全部实验日志,旨在推动全球科研社区的创新,加速AI Scientist发展[35] 公司背景与未来发展 - DeepScientist由西湖大学自然语言处理实验室(WestlakeNLP)发布,该实验室由张岳教授领导,专注于语言模型推理、泛化和通用人工智能研究[37] - 实验室已开放免费的DeepScientist服务申请,期待与科研社区共同建设更高效的科学发现新范式[36] - 未来展望为人机协同科研范式,人类角色将转向提出科学问题和设定方向,AI则作为“科学探索引擎”进行广泛探索[34][35]