核心观点 - 谷歌最新AI系统在科研领域实现突破性进展 能够自主提出新方法、验证实验结果并在六大科学领域超越专家水平 将数月研究周期压缩至数小时 [1][3][6] 实证软件概念 - 提出"实证软件"新范式 以最大化预设质量评分为目标 区别于传统软件的功能正确性导向 [5][9][10] - 将科研问题抽象为可计分任务 包含问题描述、评估指标和数据集三大要素 [11][12] - AI系统通过生成代码、沙箱运行、树搜索筛选和迭代优化的闭环流程自主寻找最优解 [13][15] 技术实现机制 - 基于大语言模型生成可执行代码 通过树搜索方法筛选候选方案并持续优化 [13] - 输出成果具备可验证、可解释和可复现的科研标准特性 [15] - 系统能够快速探索成千上万种方案 将数月研究周期压缩至数小时 [33][34] 基因组学领域表现 - 在单细胞RNA测序批次整合任务中 通过组合BBKNN和ComBat方法创新解法 [17][19] - 在OpenProblems V2.0.0综合指标上超越最佳人工方法14% [19] 公共健康领域表现 - 在新冠住院预测任务中自动生成14个模型 集体表现超越CDC官方CovidHub Ensemble黄金标准 [22] 地理遥感领域表现 - 在高分辨率遥感图像分割任务中生成三种模型均超越现有方法 [22] - 分割精度(mIoU)突破0.80 融合U-Net和SegFormer架构并结合图像增强技术 [22] 神经科学领域表现 - 在斑马鱼全脑7万神经元活动预测中击败所有基线方法 [24] - 创新设计结合生物物理模拟器的混合模型TS-Jaxley 提升可解释性 [26] 数学领域表现 - 成功求解19个棘手积分任务中的17个 标准数值方法几乎全军覆没 [27][28] - 展示在复杂数学场景中寻找突破口的深层能力 [28] 时间序列领域表现 - 在GIFT-Eval基准上从零构建通用预测库 覆盖28个数据集和7个领域 [29] - 适配从秒到年的10种时间频率 实现跨领域泛化能力 [29][30] 系统创新特性 - 展现跨学科通用性 在基因组学、神经科学等领域均实现方法创新 [31] - 具备零样本泛化、高维信号处理、不确定性量化等综合能力 [31] - 首次在公开基准上全面跑通pipeline并产出可量化专家级结果 [31] 科研范式变革 - AI从单点突破走向跨领域科研合作者 与FunSearch和AI co-scientist形成同一赛道 [37] - 科学家角色转向提出方向、判断价值和定义优先级 [35][36] - 谷歌开源系统产出方案并提供交互界面追踪搜索过程 [38][39]
刚刚,谷歌发布71页AI科研报告,6大领域全面超越专家,几小时顶几个月