科学计算软件 - 财报，业绩电话会，研报，新闻

科学计算软件

搜索文档

量子位· 2026-01-13 17:50

文章核心观点 - 当前科学软件领域存在严重的“部署瓶颈”，绝大多数开源工具停留在“被发布过”而非“可直接运行”的状态，这严重制约了科学研究的可复现性、大规模评估和系统性集成 [3][4][6] - 随着AI for Science (AI4S) 和 Agentic Science 的兴起，工具是否“真的能跑”从工程细节变为第一性问题，成为制约其规模化发展的结构性瓶颈 [8][9][11] - Deploy-Master 项目被提出，旨在通过构建一个以执行为中心的一站式自动化工作流，将科学软件系统性转化为可执行事实，从而为智能体提供稳定、可复现的执行地基 [11][12][36] 科学软件部署现状与挑战 - 科学计算领域积累了数量空前的开源软件工具，覆盖生物信息学、化学模拟、材料计算、物理仿真与工程设计等众多学科方向 [1][2] - 绝大多数科学软件难以直接运行，研究团队常需花费数天甚至数周解决编译失败、依赖冲突、系统不兼容等问题，导致运行环境临时、不可移植且难以复现 [3][4] - 这种模式不仅效率低下，更在结构上限制了科学软件的可复现性、大规模评估以及系统性集成 [5][6] - 即便容器化、云计算和HPC平台降低了算力门槛，“部署瓶颈”依然长期存在并制约着科学软件的可用性 [7] AI4S与Agentic Science对部署的新要求 - 在AI for Science新范式中，AI系统需要与真实科学工具紧密交互，调用求解器、执行模拟程序等，因此工具是否“真的能跑”成为第一性问题 [8][9] - 在Agentic Science场景中，若工具依赖隐含环境、执行脆弱，将导致智能体规划无法落地，执行失败无法被结构化分析，阻碍可学习执行轨迹的形成 [10] - 工具是否部署就绪，已成为制约AI4S与Agentic Science规模化发展的结构性瓶颈 [11] Deploy-Master解决方案概述 - Deploy-Master被设计为一个以执行为中心的一站式自动化工作流，围绕工具发现、理解、环境构建和最终执行这条连续链路展开 [12] - 其直接产出是一个由数万条经过执行验证的工具构成的集合，为社区Agent与各类Master Agent提供了长期缺失的稳定执行前提 [35] - 该方法论的意义不局限于科学计算，科学工具被视为自动化部署中最困难的一类，若在此场景能成功，结论表明问题核心在于是否建立了以执行为核心的基础设施 [36] 工具发现与筛选 (Search Agent) - 团队从91个科学与工程领域出发，构建覆盖AI4S应用场景的学科空间，并使用语言模型扩展关键词，在GitHub与公共网络进行大规模检索 [14] - 通过依赖关系、引用关系等信号对初始召回仓库进行迭代扩展，避免仅依赖关键词搜索的盲区 [14] - 通过结构启发式规则和Agent语义判断进行筛选，将最初约50万个仓库收敛为52,550个进入自动部署流程的科学工具候选 [15] 自动化构建与验证 (Build Agent) - 面对构建信息零散、不完整甚至矛盾的情况，Build Agent系统遍历仓库构建线索并补充检索，生成初始构建方案 [18][19][20] - 早期实验表明，仅依赖单一模型生成构建规格的成功率只有50%–60% [21] - 引入双模型评审与辩论机制，通过多轮交互修正方案，将整体构建成功率提升到了95%以上 [21][22] - 每个工具最终通过一个最小可执行命令进行验证，只有通过验证的才会被视为成功部署并被注册发布 [23] 部署规模与特征分析 - 从构建时间分布看，大规模部署过程不均匀，大多数工具可在7分钟左右完成构建，但整体呈明显长尾特征 [25] - 在成功部署的50,112个工具中，覆盖了170多种编程语言，Python占比最大，其次是C/C++、Notebook、R、Java等 [27][28] - 绝大部分语言部署成功率维持在较高水平，少数较低的语言（如C/C++、Fortran）主要因依赖复杂编译链或系统级库，反映了环境耦合强度的影响 [28][29][30] - 在2,438次失败的构建尝试中，失败原因高度集中，最主要的来源是构建流程错误（如步骤不一致、关键依赖缺失、编译器不匹配），远多于资源不足或网络异常等问题 [31][32][33] 项目意义与未来展望 - Deploy-Master建立的可观测性，让“科学软件难以部署”从经验判断转化为可量化、可分析、可持续改进的工程对象 [34] - 只有当工具被统一构建、验证并注册为可执行能力，Agent才真正拥有稳定的行动空间，规划、执行与学习之间的闭环才得以成立 [36] - 在Agentic Science时代，执行不是推理后的附属步骤，而是所有能力得以成立的前提 [37] - 项目未来仍需面对异构硬件、分布式计算、语义级I/O接口等挑战 [36]

让两个大模型「在线吵架」，他们跑通了全网95%科研代码｜深势发布Deploy-Master

机器之心· 2026-01-09 14:16

科学软件部署的现状与瓶颈 - 绝大多数科学软件停留在“被发布过”而非“可直接运行”的状态，部署过程常需数天甚至数周解决编译、依赖和兼容性问题[3] - 这种手工维护、不可移植的模式在结构上限制了科学软件的可复现性、大规模评估和系统性集成[3] - 随着AI for Science兴起，工具是否“真的能跑”从工程细节变为第一性问题，AI系统需与科学工具紧密交互[3] - 在Agentic Science场景中，工具部署就绪问题更加尖锐，成为制约其规模化发展的结构性瓶颈[4][5] Deploy-Master项目的目标与设计 - 项目旨在解决科学软件“部署瓶颈”，核心判断是问题不在于工具不够多，而在于缺乏将工具系统性转化为可执行事实的共享基础设施[5] - 项目围绕“发现、理解、构建、执行”的连续部署链路，设计为以执行为中心的一站式自动化工作流[5] 工具发现与筛选流程 - 从91个科学与工程领域出发构建学科空间，使用语言模型扩展关键词，在GitHub等平台进行大规模检索[8] - 通过依赖、引用等信号迭代扩展初始“锚点”仓库，避免关键词搜索盲区[8] - 通过多阶段漏斗流程，从最初约50万个仓库收敛为52550个进入自动部署流程的科学工具候选[9] 自动化构建与验证机制 - 面对构建信息零散、不完整的现实，Build Agent系统遍历构建线索并生成初始方案[13] - 引入双模型评审与辩论机制，通过模型间多轮交互修正方案，将构建成功率从50%–60%提升至95%以上[13] - 每个工具通过最小可执行命令验证，成功部署的工具被结构化、注册并发布至玻尔与SciencePedia平台[13] 部署规模、成本与可观测性 - 构建时间分布呈现长尾特征，大部分工具可在7分钟左右完成，部分涉及复杂编译的工具耗时显著更长[15] - 在成功部署的50112个工具中，覆盖了170多种编程语言，Python占比最大，其次是C/C++、Notebook、R、Java等[16] - 部署成功率在大部分语言中维持较高水平，少数较低情况集中在依赖复杂编译链或系统级库的语言，如C/C++、Fortran[16] - 在2438次构建失败中，失败原因高度集中，最主要来源是构建流程错误，远多于资源、网络或权限问题[16] - 统一的执行基础设施使“科学软件难以部署”从经验判断转化为可量化、可分析、可改进的工程对象[17] 对Agentic Science与更广泛生态的意义 - 项目为社区Agent与各类Master Agent提供了长期缺失的基础前提，即经过执行验证的稳定行动空间[19] - 使得不同来源的社区Agent可以共享同一批可执行工具能力，无需各自维护脆弱环境[19] - 科学工具被视为自动化部署中最困难的一类，在此“最难场景”的成功表明，核心问题在于是否建立以执行为核心的基础设施[19] - 这一判断适用于更广泛的软件工具生态，只要工具需要被执行，就无法绕开“不完美信息”的现实前提[20] - 在Agentic Science时代，执行不是推理后的附属步骤，而是所有能力得以成立的前提[20]