Anthropic发布Claude Opus 4.7模型 - 核心观点:Anthropic正式发布其最新大型语言模型Claude Opus 4.7,该模型在高级软件工程、多模态理解、金融分析及网络安全等专业任务上相比前代Opus 4.6有显著性能提升,并引入了更细粒度的推理控制和新功能,旨在提升生产力,但需要用户调整使用方式以充分发挥其能力[2][9][42] 模型性能表现 - 高级软件工程任务:在Agentic coding SWE-bench Pro评测中,Opus 4.7得分64.3%,高于Opus 4.6的53.4%和GPT-5.4的57.7%[4] - 金融分析任务:在Finance Agent v1.1评测中,Opus 4.7得分64.4%,优于Opus 4.6的60.1%和GPT-5.4 Pro的61.5%,达到当前最优表现[5][11] - 网络安全能力:在CyberGym漏洞复现评测中,Opus 4.7得分73.1%,略低于Opus 4.6的73.8%,但高于GPT-5.4的66.3%[5] - 研究生级推理:在GPQA Diamond评测中,Opus 4.7得分94.2%,高于Opus 4.6的91.3%,与Gemini的94.3%和GPT-5.4 Pro的94.4%相当[5] - 多模态视觉推理:在视觉推理CharXiv评测中,Opus 4.7无工具时得分82.1%,高于Opus 4.6的69.1%;使用工具时得分91.0%,高于Opus 4.6的84.7%[6] - 多语言问答:在MMMLU评测中,Opus 4.7得分91.5%,略高于Opus 4.6的91.1%,但低于GPT-5.4的92.6%[6] 核心能力升级 - 指令遵循:Opus 4.7在指令遵循方面有显著提升,会严格、逐字执行指令,用户需要重新调优prompt以适应此变化[10] - 视觉能力:模型可处理长边最高2576像素(约375万像素)的图像,是此前Claude模型的三倍以上,能读取复杂截图、提取图表数据及执行需要像素级精度的任务[10] - 记忆能力:更善于利用基于文件系统的记忆机制,能在跨会话的长周期任务中记住关键信息,减少前期上下文输入的负担[12] - 推理强度控制:新增“xhigh”(超高)推理强度档位,介于high和max之间,允许用户在复杂问题上更灵活地权衡推理深度与延迟[16] 配套功能与工具更新 - Claude Code新功能:新增/ultrareview命令,可开启专门的代码审查会话,自动识别潜在bug和设计问题;Pro和Max用户可获得三次免费体验[17] - 自动模式扩展:Auto mode已扩展至Max用户,该模式允许Claude代替用户做出部分决策,减少中断,更顺畅地执行长任务[17] - 权限管理技能:新增/fewer-permission-prompts技能,可扫描会话历史,将安全但反复触发权限提示的命令推荐加入允许列表,减少打断[27][28] - 任务回顾功能:为每个agent生成简短总结,说明“刚刚做了什么”和“接下来要做什么”,帮助用户在长时间任务后快速恢复上下文[30][31] - 专注模式:CLI中新增可隐藏所有中间过程、只保留最终结果的模式,用户可通过/focus开关此模式[33][34] 使用方式与效率优化 - 自适应思考机制:Opus 4.7改用自适应思考机制,不再依赖固定的thinking budget,用户主要通过effort参数来控制模型思考深度,低effort响应更快、token消耗更低,高effort则能力更强[36][37] - 验证机制的重要性:为Claude提供自我验证手段(如启动服务测试、控制浏览器或使用computer use)可将其效果提升2–3倍,对于确保长时间运行任务的结果可用性至关重要[39][41] - 自动化流程技能:例如/go技能,可让Claude自动完成端到端自测、运行简化技能并直接提交PR的整套流程[40] - Token使用变化:Opus 4.7使用了新的tokenizer,同一输入映射的token数量可能增加1.0–1.35倍;在更高推理强度下,尤其在agent多轮任务后期,会生成更多输出token,提升了可靠性但也增加了消耗[17] 定价与可用性 - 价格:Opus 4.7价格与Opus 4.6保持一致,输入每百万tokens 5美元,输出每百万tokens 25美元[8] - 访问方式:开发者可通过Claude API使用模型名称claude-opus-4-7[8] - 网络安全访问计划:针对有正当网络安全需求的专业人士,Anthropic推出了Cyber Verification Program供申请参与[7]
Opus 4.7 发布,Claude Code 之父传授使用心得:模型升级只是开始,开发方式才是关键
AI前线·2026-04-17 10:06