“全球最强编程模型”来了！Anthropic发布Claude 4，连干七小时性能稳定

核心观点 - Anthropic发布Claude 4系列模型，包括Opus 4和Sonnet 4，声称Opus 4为"全球最佳编程模型"，标志着AI能力的新纪元[4][5] - 新模型在编码、推理和持续工作能力方面有显著提升，可能重塑软件开发行业格局[4][5][7] - Claude Code正式上线，由Opus 4和Sonnet 4支持，提供更多功能如代码分析和无缝结对编程[11][12] - Anthropic与OpenAI、Google的竞争加剧，行业格局面临重新评估[15][17] 模型性能 - Opus 4在SWE-bench测试中准确度达72.5%，Terminal-bench达43.2%[5] - Sonnet 4在SWE-bench准确度72.7%，较Sonnet 3.7版的62.3%显著提升[3][5] - Opus 4可连续工作7小时，乐天验证其在开源重构任务中保持稳定性能[7][8] 功能升级 - 新模型采用混合模式设计，支持即时回应和深入推理[5] - 引入"扩展思考与工具使用"功能，允许网络搜索和并行工具使用[10][11] - Opus 4记忆能力大幅提升，可创建"记忆文件"存储关键信息[11] 产品发布 - Claude Code正式上线，支持GitHub Actions、VS Code和JetBrains集成[11] - Claude Code可编写代码分析数据，适合专业开发者和非编程人员[12][13] - Sonnet 4将作为GitHub Copilot新编码代理的基础模型[17] 行业竞争 - Anthropic与OpenAI、Google在顶级模型领域竞争加剧[4][15] - 微软与xAI合作，谷歌推出AI搜索功能，OpenAI收购AI硬件公司[15] - 投资者需重新评估行业格局，Anthropic可能赢得更多市场份额[17]