Anthropic新模型杀疯了！成本直降 2/3、性能直逼GPT-5，用户实测：比“吹”的还强，速度超 Sonnet 3.5 倍

Claude Haiku 4.5 产品发布与核心特性 - Anthropic 发布 Claude Haiku 4.5 版本并面向所有用户开放，该模型是其最小型模型的最新版本 [2] - 官方宣传其性能与 Sonnet 4 相近，但成本仅为后者的三分之一，速度却超过两倍 [2] - Haiku 4.5 是一款混合推理模型，能根据处理请求的需求灵活调整计算资源量，默认使用有限硬件资源，用户可开启“扩展思考”模式以生成更复杂但耗时更长的响应 [3] - 该模型能够处理包含多达 20 万个 token 信息的多模态提示词，每次响应最多可输出 6.4 万个 token，使其能处理大型商业文档 [3] - Haiku 4.5 已在全平台上线，开发者可通过 Claude API 调用，定价为每百万输入 tokens 1 美元，每百万输出 tokens 5 美元，而 Sonnet 4.5 的定价是其三倍 [9] 性能基准测试表现 - 在计算机使用能力上，Claude Haiku 4.5 优于该公司 5 月推出的中型模型 Claude Sonnet 4，在代码生成能力方面与 Claude Sonnet 4 以及 OpenAI 最新模型 GPT-5 相近 [4] - 在 SWE-Bench 验证基准测试中得分为 73%，在 Terminal-Bench 基准测试中得分为 41%，成绩低于 Sonnet 4.5，但与 Sonnet 4、GPT-5 以及 Gemini 2.5 持平 [4] - 在 OSWorld 基准测试中得分达 50.7%，显著超过 Sonnet 4 的 42.2% [7] - 借助 Python 工具支持时，该模型数学任务得分达 96.3%；即便不使用工具，也保持 80.7% 的表现 [7] - 在以终端为核心的编码任务中，Haiku 4.5 得分 41.0%，优于 Sonnet 4 的 36.4% [7] - 在多项基准测试中，Haiku 4.5 表现与主流模型相当，例如在 Agentic coding 任务中得分为 73.3%，接近 Sonnet 4 的 72.7% 和 GPT-5 的 72.8% [9] 安全性、成本优势与市场定位 - Haiku 4.5 的风险行为发生率较低，对齐表现显著优于前代产品 Haiku 3.5，在自动对齐评估中总体未对齐行为率显著低于 Sonnet 4.5 和 Opus 4.1，成为公司目前最安全的模型 [9] - 新版本对免费版本具备特殊吸引力，因能提供强大功能同时将服务器负载降至最低，意味着所有用户都能通过 Claude.ai 免费使用接近前沿水平的智能 [2] - 用户测试反馈显示，Haiku 4.5 速度大概是 Sonnet 的 3.5 倍，用户体验感更好 [10] - 公司明确其市场定位：Sonnet 4.5 仍是性能最强的模型，而 Haiku 4.5 为用户提供了在追求接近前沿性能时更高成本效益的理想选择 [12] 多模型协同与企业应用场景 - Haiku 4.5 的轻量级特性使其易于并行部署多个智能体，或与更复杂模型搭配使用，例如 Sonnet 4.5 可将复杂问题拆解，协调多个 Haiku 4.5 模型组成“团队”并行完成子任务 [13] - 企业可让 Haiku 监控金融数据流，因其体型更小、成本更低、速度更快能处理更大体量数据，随后将初步洞察移交 Sonnet 进行更深入分析 [13] - 分析师指出，Anthropic 设计 Haiku 的初衷是为了辅助 Sonnet，带来高得多的成本效益比，企业应通过混合使用大型与小型模型来提升 AI 工作流的成本效益 [14] - Haiku 4.5 最直接的应用场景可能出现在软件开发工具领域，因其低延迟特性，已有企业反馈其“解锁了一整套全新应用场景” [14] 企业客户反馈与性能验证 - 代码初创公司 Augment 的联合创始人表示，该模型达到了接近前沿水平的代码生成质量，兼具极快速度与成本效益，在内部测试中实现了 Sonnet 4.5 90% 的性能 [15] - 另一家代码初创公司 Windsurf 首席执行官称，Haiku 4.5 模糊了速度、成本与质量之间传统权衡的界限 [15] - 演示软件公司 Gamma 的联合创始人表示，Haiku 4.5 在幻灯片文本生成的指令遵循能力上准确率达 65%，优于其付费层级模型的 44%，这对单位经济效益是颠覆性改变 [16] Anthropic 业务增长与行业趋势 - Anthropic 业务呈爆发式增长，月度年化收入即将突破 70 亿美元，而 8 月公布的数据为 50 多亿美元，公司设定的 2026 年年化收入目标为 200 亿至 260 亿美元，较当前水平增幅将超过 200% [18] - 公司服务的企业客户已超 30 万家，企业级产品收入约占总营收的 80%，其代码生成工具 Claude Code 年化收入已接近 10 亿美元 [18] - 行业正从“AI 错失恐惧期”转向要求可量化的投资回报，企业考量聚焦于具体的生产力提升 [19] - 五个月内，AI 性能保持稳定但价格降了原先的三分之二，若趋势持续，如今先进的 AI 能力一年内可能变得常规且廉价，AI 的基本经济逻辑正以惊人速度转变 [19] - Anthropic 估值达 1830 亿美元，正紧追估值达 5000 亿美元的 OpenAI 等竞争对手 [20] - Anthropic 押注 AI 的未来不属于能打造单一最强模型的企业，而属于能以合适价格、速度提供合适智能并让所有人都能获取的企业 [21]