Manus都点赞的Claude 4,究竟好在哪儿?
虎嗅·2025-05-23 18:53

模型升级 - Claude 4系列推出两款新模型Opus 4和Sonnet 4,彻底淘汰前代Claude 3.7 Sonnet [2] - 新模型采用混合架构,兼顾及时响应与深度思考,性能显著提升但价格保持不变 [6] - 在SWE-bench Verified基准测试中表现"遥遥领先",直接对标OpenAI的Codex-1 [6] 技术性能 - Opus 4在编码、研究、写作等复杂任务上拓展边界,被Cursor称为顶尖技术 [8] - Sonnet 4错误率从20%骤降至接近零,在自主开发应用方面表现惊艳 [8] - 综合基准测试显示在编程、推理、多模态等方面领先主流模型 [9][10] - 智能体任务中不正常行为发生率降低65%,新增记忆增强功能 [14][15] 智能体应用 - 模型名称特意加入"Agentic"前缀,强化智能体定位 [10] - 可独立编程7小时,复杂项目构建能力获Github Copilot等平台认可 [11] - 新增代码执行工具、MCP连接器等智能体专用功能 [24] - 被评价为"AI智能体时代最能用也是最好用的大模型" [25] 实际表现 - 能一次性写出8000行代码,编程时间大幅减少 [2][32] - 与Blender联动实现3D建模质变,幻觉发生率下降 [32] - 可制作音乐游戏和精美PPT,美学设计能力提升 [34][36] - 在p5js 3D空间构建中自主添加环境元素 [38][39] 行业影响 - 各大AI编程平台和智能体产品迅速接入Claude 4 [41] - 推动"大模型+智能体"深度融合的行业范式转变 [44][45] - 公司通过MCP协议和Claude 4为智能体时代按下加速键 [44]

Manus都点赞的Claude 4,究竟好在哪儿? - Reportify