Workflow
十年突破百年科研进展,Claude要做超人研究助手,宣布多项升级
36氪·2025-10-21 12:12

公司战略与愿景 - 公司宣布一系列针对其AI模型Claude的改进措施,核心目标是提升其在生命科学领域的应用能力,以加速科学进步[1] - 公司的最终目标是希望将生命科学的研发速度加快一个数量级,实现“100年的科学进展,在10年内完成”[1] - 公司希望将Claude提升至“超人研究助手”的水平,协助科学家完成科研各个阶段的任务,支持从早期研究、转化到商业化的全流程[1][4] 模型性能提升 - 最新一代模型Claude Sonnet 4.5是首款经过系统科学训练的模型,在多项生命科学基准测试中表现突出[4] - 在评估实验室方案理解与应用能力的Protocol QA测试中,Claude Sonnet 4.5得分为0.83,超越了0.79的人类基线分数,优于前代Claude Sonnet 4的0.74[4] - 在生物信息学任务评估BixBench上,新模型相比前代亦有显著提升[4] 产品功能与工具集成 - 公司推出AI编程工具Claude Code的网页版,用户可通过浏览器直接委托编程任务,无需依赖本地终端环境,支持云端并行开发、实时进度追踪及安全沙盒运行[3] - Claude Code已突破编程范畴,作为一个“通用智能体”在生命科学领域获得广泛采用,可用于起草论文、高效完成文献综述、以及智能管理研究项目[4] - 公司通过三大方向增强Claude的科学实用性:新增科学平台连接器、引入“智能体技能”以及提供生命科学专用的提示词库和专业支持[5] 科学工具生态集成 - 公司新推出的一系列连接器旨在让Claude能够直接访问并操作专业科学工具与数据库,覆盖当前主流的科学工具和数据库[6] - 连接器包括Benchling、BioRender、PubMed、Scholar Gateway、Synapse.org、10x Genomics等,使Claude能够提供有据可查的科学问答,绘制合规的科研图表,并进行数据分析类任务[6][7] - 这些科学专用连接器将与现有的通用工具及数据分析平台形成互补[7] 智能体技能与标准化 - 公司引入“智能体技能”功能,技能是包含指令、脚本和资源的预设包,能使Claude在执行特定任务时遵循既定方案,保证操作的一致性和可预测性[8] - 公司正在开发首批科学技能,例如基于scverse最佳实践的“single-cell-rna-qc”技能,用于对单细胞RNA测序数据进行自动化质量控制和过滤[8] - 公司鼓励科学家根据自身需求构建自定义技能[8] 应用场景与行业影响 - 增强后的Claude现可支持多种生命科学任务,包括进行文献综述、提出可检验的假设、起草研究方案、标准操作程序等文件[10] - Claude可完成复杂任务,例如在Claude Code中处理分析基因组数据,并以多种格式呈现结果,或协助起草、审阅监管提交文件并汇编合规数据[10] - 公司通过“AI for Science”计划为从事高影响力科研项目的领先实验室提供免费的API积分支持,旨在促进前沿探索并识别Claude的新应用场景[11]