Workflow
就是阻击OpenAI,Claude抢先数十分钟发布Claude Opus 4.1
机器之心·2025-08-06 09:49

模型发布动态 - Anthropic抢先OpenAI半小时发布Claude Opus 4 1模型 时间点高度接近引发行业关注[1][2] - 模型迭代速度显著加快 距Opus 4发布仅三个月即推出升级版本[6][7] 技术性能升级 - 上下文窗口扩展至200K 智能体任务 真实世界编程和推理能力实现大幅提升[7] - 多文件代码重构表现突出 企业案例显示能精准定位修改点且不引入新bug[14] - 在SWE-bench基准测试中领先 工程任务完成度达74 5% 较Opus 4提升2个百分点[16] - 终端编程测试Terminal-Bench得分43 3% 较前代提升4 1个百分点[16] 商业化进展 - 定价策略采用输入15美元/百万token 输出75美元/百万token 提示缓存可降本90%[10][11] - 已覆盖Claude Pro Max Team及Enterprise用户 集成至Claude Code开发环境[8][9] - 支持混合推理模式 API用户可精细控制思维预算以优化成本性能比[17] 应用场景突破 - 高级编程场景支持32K输出token 可适配特定编程风格完成大规模代码生成[18] - 智能体搜索场景表现强劲 能自主分析专利 论文 市场报告等多源数据[18] - 企业反馈初级开发者评估基准提升幅度相当于Sonnet 3 7到4 0的跨越式进步[15] 行业竞争格局 - 与GPT-4和Gemini 2 5 Pro横向对比 在研究生级推理GPQA测试中得分80 9% 低于竞品[16] - 视觉推理MMMU测试得分77 1% 较Opus 4提升0 6个百分点但仍落后GPT-4 5 8个百分点[16] - 国际象棋比赛首日Opus 4负于Gemini 2 5 Pro 引发对4 1版本竞技表现的期待[22]