Claude 4连续自动编程7小时,刷新世界记录
行业动态 - Anthropic公司发布最新大模型Claude 4 包含Opus 4和Sonnet 4两个版本 [1] - Opus 4定位为全球顶级编程模型 擅长复杂长时间推理任务 尤其在Agent领域表现突出 [1] - Sonnet 4是Sonnet 3.7的迭代版本 在编程领域性能显著提升 [1] 技术突破 - Opus 4打造的编程智能体实现连续稳定工作7小时 刷新了OpenAI此前保持的纪录 [1] - Sonnet 4在SWE-bench测试中达到72.7%准确率 超越OpenAI的Codex-1和o3等前沿模型 [1] 性能对比 - Rakuten测试数据显示Opus 4在长时间任务稳定性方面建立新标杆 [1] - Sonnet 4相较前代版本取得显著进步 在编程基准测试中建立竞争优势 [1] 产品发布 - Anthropic选择在首届开发者大会发布Claude 4 凸显其对开发者生态的重视 [1] - 产品采用双版本策略 分别针对高性能和通用编程场景进行优化 [1]