AI推理市场规模与算力需求 - 预测AI推理将成为全球最大市场之一,规模超越石油,将占到全球GDP的若干个百分点 [3] - 到2030年,仅OpenAI和Anthropic两家公司的合计算力需求将超过100吉瓦 [1] - 模型能力扩张速度持续快于算力增长,导致算力供给长期短缺 [3][4] 算力部署的时空演变 - 未来3-5年,太空数据中心提供的算力可忽略不计,但到2040年,全球超过一半的新增算力将部署在太空 [1][4] - 到2040年,用于推理的算力总量可能达到太瓦级别 [4] - 2030年时,太空算力占比预计不到1% [4] 硬件与软件的协同设计效应 - 过去三年整体智能效率提升远超硬件带来的30倍增益,大部分提升来自模型层优化 [5] - 通过跨层(硬件、基础设施、模型、应用)协同优化,可实现100倍的性能提升,而非各层独立优化带来的8倍效果 [5] - DeepSeek的专家模型专门为英伟达Hopper架构优化,因此在GPU上表现出色,但在TPU上表现不佳 [6] AI芯片的竞争格局与生态壁垒 - 谷歌TPU是一款出色的芯片,承担了DeepMind所有推理和Anthropic几乎所有预训练,但无法高效运行为GPU优化的模型(如DeepSeek) [6][7] - 所谓“CUDA护城河”的本质是开源生态的模型形状问题,大量开源模型(如DeepSeek、Kimi、阿里、腾讯的模型)为GPU协同优化,在TPU上效果差 [7] - 谷歌需要建立自己的开源模型生态(Gemma系列)来对抗这一效应 [7] 英伟达的战略布局 - 英伟达CEO黄仁勋大力扶持新兴云厂商,旨在防止超大规模云厂商垄断算力市场,创造一个多极化的世界格局 [8] - 该战略的逻辑是:如果全球仅由OpenAI、Anthropic和Google的模型主导,且算力仅由超大规模云商建设,英伟达将陷入被动 [9] - 通过向新兴云商(如Crusoe、CoreWeave)销售GPU,可以削弱谷歌TPU和亚马逊Trainium的长期市场地位,这对英伟达更有利 [9] 推理成本与效率趋势 - 根据InferenceX基准测试系统数据,在等效质量下,AI推理成本每年下降约60倍 [12] - 每瓦智能(intelligence per watt)的年改善幅度约为40倍,略低于成本降幅,部分效率提升来自非功耗环节 [12] - InferenceX系统已获得超过5000万美元的硬件捐赠,每日在超过15种不同芯片类型上对最新模型进行实时测试 [12] 行业研究方法论 - InferenceX的核心输出是“帕累托最优曲线”,该曲线在响应延迟与批处理吞吐量之间找到每个场景的最优配置点,并将配置开源 [12] - 这条曲线是硬件、基础设施、模型和应用层所有决策的上游依据,商业化案例如Anthropic的Claude Code快速模式和OpenAI的优先队列 [12]
SemiAnalysis创始人:推理或超越石油成全球最大市场,2040年太空数据中心将主导全球算力