算力服务预留定价模式
搜索文档
新一轮大模型要来了!Blackwell加持下,AI能力更强了?
华尔街见闻· 2026-05-29 17:11
AI大模型行业核心观点 - AI大模型竞争正迈入以英伟达Blackwell架构为关键催化剂的新技术节点,首批基于此架构训练的旗舰模型即将亮相,有望与现有产品形成能力断层 [1][5][6] - 行业呈现强劲且垂直拉升的需求态势,但供给侧增速相对渐进,算力与推理成本双双走高,供需错配格局正在重塑整个行业的定价与商业化逻辑 [2][3][5] 技术节点与模型发布 - **Blackwell架构成为关键催化剂**:花旗研究将“首批基于Blackwell架构训练的模型”列为近期最重要的技术催化剂,其算力优势尚未体现在现有顶级模型上,市场预期其落地将带来明显能力跃迁 [1][6] - **密集的模型发布日程**:未来数月发布节点密集,包括谷歌Gemini 3.5 Pro(预计二季度)、Anthropic Claude Sonnet 4.7(预计二季度)、OpenAI GPT-6.0(排期三季度)以及Claude Opus 5、Sonnet 5等(定档四季度)[7] - **“前Blackwell时代”的最后顶级模型**:Anthropic的Claude Mythos预览版被视为当前架构的能力天花板,其之后的重磅模型将首批受益于Blackwell算力红利 [6] 主要厂商动态与产品进展 - **Anthropic加速迭代**:提前发布Claude Opus 4.8,核心升级包括新增“投入控制”机制、推出“动态工作流”研究预览版以及着力提升“诚实度”[9][10] - **Claude Opus 4.8性能与定价**:在Online-Mind2Web基准测试中获得84%,优于Opus 4.7和GPT-5.5;定价维持每百万输入token 5美元、输出token 25美元,并新增速度为标准模式2.5倍的“快速模式”[11] - **xAI的Grok-5**:马斯克披露参数达1.5万亿的Grok-5训练已完成,预计2至3周内发布,参数规模是当前Grok-4的三倍,并整合了来自Cursor的大量编程数据以增强编程能力 [13][14][15] - **MiniMax的新模型**:工程主管预告采用全新稀疏注意力机制的MiniMax-M3即将推出,据称预填速度可提升9.7倍、解码速度提升15.6倍,有望延续其在性价比赛道的优势 [16][17] - **其他竞争者**:DeepSeek V4 Pro、Qwen3.6 Plus、Kimi K2.6等产品相继入场,前沿模型竞争多极化趋势清晰 [19] 市场需求与采用情况 - **需求呈现“垂直墙”式增长**:OpenAI首席财务官用此描述需求增速,具体数据包括:谷歌每月处理的tokens量达3.2千万亿(Q),同比增长7倍;Anthropic预计二季度末年化收入(ARR)约达500亿美元,较3月底的300亿美元大幅跳升;OpenAI一季度单季收入57亿美元,已超去年上半年总和(约43亿美元)[2][20][21] - **企业采用仍处早期**:花旗认为企业端AI采用加速仍处于早期阶段,需求天花板远未到来 [22] - **AI对生产效率的冲击**:Intuit、Meta及Cisco相继宣布裁员,被解读为AI加速冲击传统生产效率场景的潜在信号 [23] 行业定价逻辑演变 - **推理定价双轨化**:高端前沿推理定价坚挺甚至上涨(如GPT-5.5相较GPT-5.4价格约上涨2倍),而接入层面竞争加剧(如谷歌下调AI Ultra订阅价格并推出新档位)[24][25] - **企业端成本压力**:据OpenRouter分析,不同工作负载下使用GPT-5.5的成本增幅为49%至92%,部分被输出tokens减少19%至34%所抵消 [25] 供给约束与商业模式创新 - **算力稀缺催生预留定价**:供给增速跟不上需求,推动AI算力服务模式向类云计算转变,例如OpenAI推出“保证容量”方案,企业可通过1到3年合约锁定算力并获得折扣 [28][29] - **人才成为关键约束**:顶尖AI研究员(如Andrej Karpathy加入Anthropic)的流向被视为比算力更能预示前沿能力发展的指标 [29] - **算力租赁市场升温**:花旗追踪的Blackwell系列芯片租赁价格自2025年下半年以来持续攀升,反映市场对下一代训练算力的强劲需求 [8]