核心观点 - Anthropic发布Claude 4系列模型,包括Opus 4和Sonnet 4,声称Opus 4为"全球最佳编程模型",标志着AI能力的新纪元[4][5] - 新模型在编码、推理和持续工作能力方面有显著提升,可能重塑软件开发行业格局[4][5][7] - Claude Code正式上线,由Opus 4和Sonnet 4支持,提供更多功能如代码分析和无缝结对编程[11][12] - Anthropic与OpenAI、Google的竞争加剧,行业格局面临重新评估[15][17] 模型性能 - Opus 4在SWE-bench测试中准确度达72.5%,Terminal-bench达43.2%[5] - Sonnet 4在SWE-bench准确度72.7%,较Sonnet 3.7版的62.3%显著提升[3][5] - Opus 4可连续工作7小时,乐天验证其在开源重构任务中保持稳定性能[7][8] 功能升级 - 新模型采用混合模式设计,支持即时回应和深入推理[5] - 引入"扩展思考与工具使用"功能,允许网络搜索和并行工具使用[10][11] - Opus 4记忆能力大幅提升,可创建"记忆文件"存储关键信息[11] 产品发布 - Claude Code正式上线,支持GitHub Actions、VS Code和JetBrains集成[11] - Claude Code可编写代码分析数据,适合专业开发者和非编程人员[12][13] - Sonnet 4将作为GitHub Copilot新编码代理的基础模型[17] 行业竞争 - Anthropic与OpenAI、Google在顶级模型领域竞争加剧[4][15] - 微软与xAI合作,谷歌推出AI搜索功能,OpenAI收购AI硬件公司[15] - 投资者需重新评估行业格局,Anthropic可能赢得更多市场份额[17]
“全球最强编程模型”来了!Anthropic发布Claude 4,连干七小时性能稳定
硬AI·2025-05-23 23:03