带验证器的强化学习 - 财报，业绩电话会，研报，新闻

带验证器的强化学习

搜索文档

大模型年中报告：Anthropic 市场份额超 OpenAI，开源模型企业采用率下降

Founder Park· 2025-08-04 21:38

基础大模型发展趋势 - 基础大模型正成为生成式AI核心引擎并重塑计算未来其能力与成本控制的演进将推动系统应用及产业格局变革 [2] - 模型API支出在6个月内从35亿美元增长至84亿美元企业重心从训练微调转向模型推理标志阶段性转折 [2] - 代码生成成为首个大规模爆发的AI应用场景基础模型能力升级路径新增"带验证器的强化学习"(RLHF with verifiers) [2] 市场竞争格局变化 - Anthropic以32%企业使用率超越OpenAI(25%)和Google(20%) 成为市场新领跑者 Meta Llama占9% DeepSeek仅1% [9] - Anthropic崛起始于2024年6月Claude Sonnet 3 5发布 2025年系列版本(Claude Sonnet 3 7/4 Opus 4 Claude Code)巩固领先地位 [12] - 企业投入集中流向少数高性能闭源模型开源采用趋势因前沿突破放缓而减弱 [3] Anthropic成功驱动因素 - 代码生成领域占据42%市场份额(OpenAI为21%) 催生19亿美元生态系统及AI IDE 应用构建工具等新形态产品 [13][14] - 采用带可验证奖励的强化学习(RLVR)突破数据瓶颈成为提升模型可靠性与实际能力的关键路径 [15] - 率先实现Agent范式突破通过多轮自我优化及工具调用提升模型执行力 2025年被称为"Agent之年" [16] 开源模型发展现状 - 开源模型运行任务占比从19%降至13% Meta Llama仍领先但Llama 4表现未达预期 [17] - 中国公司贡献突出开源模型(DeepSeek 字节跳动阿里巴巴等) 但性能落后前沿闭源模型9-12个月叠加部署复杂度导致份额停滞 [17][20] - 开源吸引力在于定制化成本优势及私有化部署但初创企业生产负载正加速转向闭源 [20] 企业模型选择行为 - 66%开发者选择原供应商升级仅11%切换供应商性能(非价格)是核心决策因素 [24][27] - 性能优先逻辑下旧模型即使降价十倍也无法挽回用户 Claude 4发布一个月内即抢占45%用户 [27][30] - AI支出从训练转向推理初创企业推理任务占比从48%升至74% 近半数企业主要计算任务由推理驱动 [31]