Workflow
Claude 4发布!AI编程新基准、连续编码7小时,混合模型、上下文能力大突破
Founder Park·2025-05-23 09:42

Claude 4模型发布 - Claude 4包含Opus 4和Sonnet 4两款模型,分别针对复杂任务和高效推理场景 [2][4][5] - Opus 4在SWE-bench和Terminal-bench测试中以72.5%和43.2%得分领先行业,Sonnet 4在SWE-bench达72.7% [13][18][23] - 新模型支持并行工具使用、本地文件访问记忆增强、长达1小时的提示词缓存等API功能 [6][32][10] 技术突破 - 首次实现工具使用与推理过程同步,比传统分阶段处理更贴近人类认知模式 [27][28][29] - 模型走捷径行为比前代减少65%,记忆能力显著提升,可创建导航指南等长期记忆文件 [31][32][33] - 连续7小时稳定运行复杂任务,完成开源代码重构等超长周期工作 [14][20][43] 开发者生态 - 提供VS Code/JetBrains原生集成,支持GitHub Actions后台任务和实时结对编程 [6][48][49] - 定价维持Opus 4每百万Token 15/75美元(输入/输出),Sonnet 4为3/15美元 [11] - 通过Amazon Bedrock Converse API实现跨模型兼容,降低基础设施管理成本 [10][12] 行业影响 - 推理模型使用量4个月内增长5倍,占AI交互比例从2%升至10% [26] - 在Cursor、Replit等平台实测显示代码理解能力和跨文件处理精度显著提升 [20][21] - 推动AI智能体向虚拟协作者进化,保持长期上下文理解与任务连贯性 [55] 产品特性 - 新增扩展思考模式,支持网络搜索等工具动态调用优化响应质量 [6] - 思考摘要功能自动精简5%冗长推理过程,其余95%保持完整输出 [34] - 免费用户可体验Sonnet 4,Pro/Team/Enterprise用户获全功能访问 [8][9]