Workflow
大模型语言操作系统
icon
搜索文档
能连续干活超30小时!Claude发起AI编程新一轮竞赛
第一财经资讯· 2025-09-30 12:13
产品发布与性能 - Anthropic于北京时间9月30日正式发布Claude Sonnet 4 5,官方称其为世界上最好的编程模型,在智能体构建、计算机使用、推理和数学能力上有显著突破[1] - Claude Sonnet 4 5能够在复杂、多步骤任务中保持超过30小时的持续注意力,可自主处理30多个小时的代码[1] - 在SWE-bench Verified测试中,Claude Sonnet 4 5以82 0%的成绩登顶业界第一,比GPT-5-Codex高出7 5个百分点[3] - 在OSWorld基准测试中,Sonnet 4 5以61 4%的得票率领先,而4个月前Sonnet 4的得票率为42 2%[3] - 根据官方评测数据,Sonnet 4 5在多项关键指标上超越主要竞争对手:Agentic coding达77 2%(GPT-5为72 8%),Agentic terminal coding达50 0%(GPT-5为43 8%),Financial analysis达55 3%(GPT-5为46 9%)[5] - 该模型在金融、法律、医学和STEM领域显示出更好的领域特定知识和推理能力[5] 产品功能与体验 - 产品体验升级包括新增检查点功能可随时保存进度并一键回退,终端界面翻新,代码执行和文件创建直接整合到对话中[6] - Claude现可直接在浏览器中工作,导航站点,填写电子表格和完成任务[6] - 推出临时预览功能Imagine with Claude,可实时生成软件,所有代码均为实时互动创建,该功能在接下来五天内仅对Max订阅用户开放[6] 市场竞争与行业动态 - Anthropic此次更新时机紧随OpenAI发布GPT-5-Codex之后,且在一周后OpenAI年度开发者大会之前[1] - AI编程领域创业者如Cursor CEO Michael Truell和Cognition联创兼CEO Scott Wu均对Sonnet 4 5的编码性能和规划能力提升表示认可[7][8] - 在Cursor平台上,Claude仍是最受欢迎的调用模型[8] 定价与商业化 - Sonnet 4 5定价与Sonnet 4保持一致,为3美元/百万输入tokens,15美元/百万输出tokens,但与自家上一代旗舰Opus 4 1相比,输入成本降低5倍[8] - Anthropic最新估值达1830亿美元,成为全球估值第四的独角兽,其年化收入在2025年8月已超过50亿美元,而2025年初约为10亿美元,八个月内收入快速增长[8] - Claude Code在三个月内使用量增长超10倍,产生超5亿美元的运营收入[9] 公司挑战 - 过去两个月,用户普遍反映Claude模型质量出现断崖式下滑,引发开发者大规模退订,公司回应称是因独立Bug导致,非故意降智[9]