Anthropic发布Claude Sonnet 5模型 - 公司推出新版性价比模型Claude Sonnet 5,定位为迄今为止最能干活的Sonnet模型,具备自主规划任务、调用浏览器和终端的能力[2][3] - 该模型在Agentic coding测试SWE-bench Pro上获得63.2%的分数,比上一代Sonnet 4.6的58.1%高出5个百分点[6] - 公司官方定价与Sonnet 4.6保持一致,但能力得到提升[7] 模型性能表现与定位 - Sonnet 5在多项基准测试中表现接近其顶级模型Opus 4.8:在SWE-bench Pro测试中,Sonnet 5(63.2%)与Opus 4.8(69.2%)差距为6个百分点;在OSWorld-Verified测试中,Sonnet 5(81.2%)与Opus 4.8(83.4%)差距缩小至2.2个百分点;在GDPval-AA v2知识工作测试中,Sonnet 5(1618分)甚至略高于Opus 4.8(1615分)[12] - 公司将其定位为“Opus平替”,因为其标价仅为Opus 4.8的六成左右:Opus 4.8定价为每百万输入/输出Token 5美元/25美元,而Sonnet 5为3美元/15美元,叠加限时优惠后价格可低至Opus的四成[20][21] - 早期采用公司反馈积极,AI编程平台Factory的工程师指出该模型为其智能体提供了扎实的多步骤软件工程执行能力;自动化平台Zapier的工程师举例称其能无中断地完成两段式任务[14][15][16] 实际使用成本分析(隐藏式涨价) - 尽管官方宣称“价格不变”,但开发者发现由于采用了新的分词器,处理相同内容实际消耗的Token数量大幅增加,导致实际费用上涨[23] - 实测数据显示,处理英文文档时,Token数量从Sonnet 4.6的2356个增至Sonnet 5的3341个,涨幅达42%;处理西班牙语文档时涨幅为33%;处理一份4279行Python代码时,Token数量从44014涨至56118,涨幅为27%;仅简体中文文档的Token消耗几乎未变(从3334增至3360,涨幅1%)[24][25][26][27] - 综合影响下,处理同样一段英文文字的实际花费比Sonnet 4.6时代高出四成多[29] - 更有开发者实测发现,在运行Artificial Analysis Intelligent Index任务时,Sonnet 5平均花费2.29美元,反而比Opus 4.8的1.8美元高出27%;对于同一任务,Sonnet 5消耗的Token数量可达Opus的两倍;跑完整个Benchmark的总花费,Sonnet 5比Opus还高出6.8%[31][33][35] 行业竞争与替代选择 - 有开发者指出,智谱AI的GLM-5.2模型在性能上与Sonnet 5相差无几:在Terminal-Bench 2.1 Terminus-2测试中,GLM-5.2为81.0%,Sonnet 5为80.4%;在SWE-bench Pro测试中,GLM-5.2为62.1%,Sonnet 5为63.2%[42][44] - 在价格上,GLM-5.2相比Sonnet 5更具优势:其输入Token价格(每百万1.4美元)仅为Sonnet 5(每百万2美元)的七成;输出Token价格(每百万4.4美元)更是不足Sonnet 5(每百万10美元)的一半[43][44] 对开发者的建议与行业定价策略对比 - 建议计划将工作流迁移至Sonnet 5的开发者,应使用Token计数工具基于自身真实工作负载进行实测,以预估实际成本,因为标价无法反映因分词器变化导致的真实账单变化[39][40] - 此次Sonnet 5的定价策略与行业其他公司不同:OpenAI在今年4月调整GPT-5.5价格时,采取了公开透明的方式,直接将每百万输入/输出Token价格从2.5美元/15美元提升至5美元/30美元;而Anthropic则保持了标价不变,将实际涨幅隐藏在了分词器换代的技术细节中[38][39]
A社你解释下,啥叫Sonnet 5比Fable 5还贵?
量子位·2026-07-01 09:02