大模型语言操作系统 - 财报，业绩电话会，研报，新闻

大模型语言操作系统

搜索文档

第一财经资讯· 2025-09-30 12:13

产品发布与性能 - Anthropic于北京时间9月30日正式发布Claude Sonnet 4 5，官方称其为世界上最好的编程模型，在智能体构建、计算机使用、推理和数学能力上有显著突破[1] - Claude Sonnet 4 5能够在复杂、多步骤任务中保持超过30小时的持续注意力，可自主处理30多个小时的代码[1] - 在SWE-bench Verified测试中，Claude Sonnet 4 5以82 0%的成绩登顶业界第一，比GPT-5-Codex高出7 5个百分点[3] - 在OSWorld基准测试中，Sonnet 4 5以61 4%的得票率领先，而4个月前Sonnet 4的得票率为42 2%[3] - 根据官方评测数据，Sonnet 4 5在多项关键指标上超越主要竞争对手：Agentic coding达77 2%（GPT-5为72 8%），Agentic terminal coding达50 0%（GPT-5为43 8%），Financial analysis达55 3%（GPT-5为46 9%）[5] - 该模型在金融、法律、医学和STEM领域显示出更好的领域特定知识和推理能力[5] 产品功能与体验 - 产品体验升级包括新增检查点功能可随时保存进度并一键回退，终端界面翻新，代码执行和文件创建直接整合到对话中[6] - Claude现可直接在浏览器中工作，导航站点，填写电子表格和完成任务[6] - 推出临时预览功能Imagine with Claude，可实时生成软件，所有代码均为实时互动创建，该功能在接下来五天内仅对Max订阅用户开放[6] 市场竞争与行业动态 - Anthropic此次更新时机紧随OpenAI发布GPT-5-Codex之后，且在一周后OpenAI年度开发者大会之前[1] - AI编程领域创业者如Cursor CEO Michael Truell和Cognition联创兼CEO Scott Wu均对Sonnet 4 5的编码性能和规划能力提升表示认可[7][8] - 在Cursor平台上，Claude仍是最受欢迎的调用模型[8] 定价与商业化 - Sonnet 4 5定价与Sonnet 4保持一致，为3美元/百万输入tokens，15美元/百万输出tokens，但与自家上一代旗舰Opus 4 1相比，输入成本降低5倍[8] - Anthropic最新估值达1830亿美元，成为全球估值第四的独角兽，其年化收入在2025年8月已超过50亿美元，而2025年初约为10亿美元，八个月内收入快速增长[8] - Claude Code在三个月内使用量增长超10倍，产生超5亿美元的运营收入[9] 公司挑战 - 过去两个月，用户普遍反映Claude模型质量出现断崖式下滑，引发开发者大规模退订，公司回应称是因独立Bug导致，非故意降智[9]