Workflow
蜂群模式
icon
搜索文档
Claude 5史诗级泄露,史上最强编程模型评测炸裂,核心秘密曝光
36氪· 2026-02-03 19:32
产品发布与性能 - 多条信息显示,Claude Sonnet 5(代号Fennec)已存在于谷歌基础设施中,其性能领先谷歌的「Snow Bunny」整整一代 [1] - 泄露信息显示,在多个内部基准测试中,Claude Sonnet 5的整体性能已超越Claude Opus 4.5,但其定位却是中端的Sonnet系列,而非旗舰Opus系列 [11] - 该模型拥有**100万token**的上下文窗口,运行速度更快,延迟更低 [3][14] - 在处理结构化视觉生成任务时,Sonnet 5展现出极强性能,例如仅凭「ASCII世界地图」提示词即生成最完整、最详细的结果 [7] - 在UI渲染和复杂代码构建方面,Sonnet 5也表现得游刃有余 [9] 编程能力与基准测试 - Claude Sonnet 5在SWE-Bench上的得分超过**80.9%**,远超当前市面上所有编程大模型,此前的最高分为**74.4%** [3][11][12] - 凭借此能力,它能独立完成大部分软件工程师日常问题,如修复bug、重构代码、补充测试、运行CI、查找回归问题等 [12] - 其编程能力结合**100万token**的上下文,意味着可将整个项目代码库输入,模型能理解全局后再动手,这对大项目、遗留系统和复杂代码库极具价值 [15] 定价策略与成本优势 - Claude Sonnet 5的定价比Claude Opus 4.5便宜**50%**,直接解决开发者对Opus「太慢、太贵」的核心不满 [3] - 其推理成本显著下降,价格仅为Claude Opus 4.5的**50%** [13] - 成本优势源于该模型直接在谷歌TPU上训练和优化,而非使用行业争抢的H100芯片 [13] 多智能体开发模式(Dev Team/Swarm) - 此次不仅是模型升级,Anthropic直接将一个开发团队塞进了模型里,推出了全新的「自动开发团队」模型,被称为Dev Team [3][16] - 在Dev Team模式下,Sonnet 5能自动生成多个子智能体并行协作,只需一句需求,即可输出完整可用、可测试、可迭代的功能模块 [17] - 这与近期关于Claude Code「蜂群模式」(Agent Swarm)的爆料密切相关,该模式包含一个「总指挥」AI和一群专业子智能体,构成层级式、依赖式、广播式及具备消息系统的协作系统 [18][20] - 开发者实测显示,执行任务时,Claude能自动创建如Team Leader、Front-end Builder、Backend Builder等角色,且Agent数量在执行中可从0自动膨胀至8个,全程无人干预,并能输出项目总结和执行报告 [23][25][27][29] - 该功能尚未完全开放,因其作为能读取全部上下文的超级调度器被认为功能过于强大和危险 [31] 公司战略与市场地位 - Anthropic选择此时发布Sonnet 5,意在正面竞争OpenAI,后者同期正猛推Codex全家桶 [32] - 公司的底气来源于雄厚的资金支持,截至2026年1月底,Anthropic已完成超过**100亿美元**融资,估值达**3500亿美元**,最终融资规模可能达到**200亿**美元 [32] - 根据Menlo Ventures 2025年第四季度的报道,Anthropic在企业市场的占有率达到**40%**,远超OpenAI的**27%**和谷歌的**21%** [32] - Claude Code的年化收入在短短半年内已突破**10亿美元** [32] 发布时间与行业影响 - 模型ID显示其可能于**2026年2月3日**发布,最快在消息泄露后的明后天 [5] - 如果泄露属实,Claude Sonnet 5(Fennec)将成为第一个真正意义上「能像团队一样工作的模型」,**2026年2月3日**可能被记为软件工程的分水岭之一 [32]