算力服务预留定价模式 - 财报，业绩电话会，研报，新闻

算力服务预留定价模式

搜索文档

华尔街见闻· 2026-05-29 17:11

AI大模型行业核心观点 - AI大模型竞争正迈入以英伟达Blackwell架构为关键催化剂的新技术节点，首批基于此架构训练的旗舰模型即将亮相，有望与现有产品形成能力断层 [1][5][6] - 行业呈现强劲且垂直拉升的需求态势，但供给侧增速相对渐进，算力与推理成本双双走高，供需错配格局正在重塑整个行业的定价与商业化逻辑 [2][3][5] 技术节点与模型发布 - **Blackwell架构成为关键催化剂**：花旗研究将“首批基于Blackwell架构训练的模型”列为近期最重要的技术催化剂，其算力优势尚未体现在现有顶级模型上，市场预期其落地将带来明显能力跃迁 [1][6] - **密集的模型发布日程**：未来数月发布节点密集，包括谷歌Gemini 3.5 Pro（预计二季度）、Anthropic Claude Sonnet 4.7（预计二季度）、OpenAI GPT-6.0（排期三季度）以及Claude Opus 5、Sonnet 5等（定档四季度）[7] - **“前Blackwell时代”的最后顶级模型**：Anthropic的Claude Mythos预览版被视为当前架构的能力天花板，其之后的重磅模型将首批受益于Blackwell算力红利 [6] 主要厂商动态与产品进展 - **Anthropic加速迭代**：提前发布Claude Opus 4.8，核心升级包括新增“投入控制”机制、推出“动态工作流”研究预览版以及着力提升“诚实度”[9][10] - **Claude Opus 4.8性能与定价**：在Online-Mind2Web基准测试中获得84%，优于Opus 4.7和GPT-5.5；定价维持每百万输入token 5美元、输出token 25美元，并新增速度为标准模式2.5倍的“快速模式”[11] - **xAI的Grok-5**：马斯克披露参数达1.5万亿的Grok-5训练已完成，预计2至3周内发布，参数规模是当前Grok-4的三倍，并整合了来自Cursor的大量编程数据以增强编程能力 [13][14][15] - **MiniMax的新模型**：工程主管预告采用全新稀疏注意力机制的MiniMax-M3即将推出，据称预填速度可提升9.7倍、解码速度提升15.6倍，有望延续其在性价比赛道的优势 [16][17] - **其他竞争者**：DeepSeek V4 Pro、Qwen3.6 Plus、Kimi K2.6等产品相继入场，前沿模型竞争多极化趋势清晰 [19] 市场需求与采用情况 - **需求呈现“垂直墙”式增长**：OpenAI首席财务官用此描述需求增速，具体数据包括：谷歌每月处理的tokens量达3.2千万亿（Q），同比增长7倍；Anthropic预计二季度末年化收入（ARR）约达500亿美元，较3月底的300亿美元大幅跳升；OpenAI一季度单季收入57亿美元，已超去年上半年总和（约43亿美元）[2][20][21] - **企业采用仍处早期**：花旗认为企业端AI采用加速仍处于早期阶段，需求天花板远未到来 [22] - **AI对生产效率的冲击**：Intuit、Meta及Cisco相继宣布裁员，被解读为AI加速冲击传统生产效率场景的潜在信号 [23] 行业定价逻辑演变 - **推理定价双轨化**：高端前沿推理定价坚挺甚至上涨（如GPT-5.5相较GPT-5.4价格约上涨2倍），而接入层面竞争加剧（如谷歌下调AI Ultra订阅价格并推出新档位）[24][25] - **企业端成本压力**：据OpenRouter分析，不同工作负载下使用GPT-5.5的成本增幅为49%至92%，部分被输出tokens减少19%至34%所抵消 [25] 供给约束与商业模式创新 - **算力稀缺催生预留定价**：供给增速跟不上需求，推动AI算力服务模式向类云计算转变，例如OpenAI推出“保证容量”方案，企业可通过1到3年合约锁定算力并获得折扣 [28][29] - **人才成为关键约束**：顶尖AI研究员（如Andrej Karpathy加入Anthropic）的流向被视为比算力更能预示前沿能力发展的指标 [29] - **算力租赁市场升温**：花旗追踪的Blackwell系列芯片租赁价格自2025年下半年以来持续攀升，反映市场对下一代训练算力的强劲需求 [8]