SemiAnalysis创始人：推理或超越石油成全球最大市场，2040年太空数据中心将主导全球算力

AI推理市场规模与算力需求 - 预测AI推理将成为全球最大市场之一，规模超越石油，将占到全球GDP的若干个百分点 [3] - 到2030年，仅OpenAI和Anthropic两家公司的合计算力需求将超过100吉瓦 [1] - 模型能力扩张速度持续快于算力增长，导致算力供给长期短缺 [3][4] 算力部署的时空演变 - 未来3-5年，太空数据中心提供的算力可忽略不计，但到2040年，全球超过一半的新增算力将部署在太空 [1][4] - 到2040年，用于推理的算力总量可能达到太瓦级别 [4] - 2030年时，太空算力占比预计不到1% [4] 硬件与软件的协同设计效应 - 过去三年整体智能效率提升远超硬件带来的30倍增益，大部分提升来自模型层优化 [5] - 通过跨层（硬件、基础设施、模型、应用）协同优化，可实现100倍的性能提升，而非各层独立优化带来的8倍效果 [5] - DeepSeek的专家模型专门为英伟达Hopper架构优化，因此在GPU上表现出色，但在TPU上表现不佳 [6] AI芯片的竞争格局与生态壁垒 - 谷歌TPU是一款出色的芯片，承担了DeepMind所有推理和Anthropic几乎所有预训练，但无法高效运行为GPU优化的模型（如DeepSeek） [6][7] - 所谓“CUDA护城河”的本质是开源生态的模型形状问题，大量开源模型（如DeepSeek、Kimi、阿里、腾讯的模型）为GPU协同优化，在TPU上效果差 [7] - 谷歌需要建立自己的开源模型生态（Gemma系列）来对抗这一效应 [7] 英伟达的战略布局 - 英伟达CEO黄仁勋大力扶持新兴云厂商，旨在防止超大规模云厂商垄断算力市场，创造一个多极化的世界格局 [8] - 该战略的逻辑是：如果全球仅由OpenAI、Anthropic和Google的模型主导，且算力仅由超大规模云商建设，英伟达将陷入被动 [9] - 通过向新兴云商（如Crusoe、CoreWeave）销售GPU，可以削弱谷歌TPU和亚马逊Trainium的长期市场地位，这对英伟达更有利 [9] 推理成本与效率趋势 - 根据InferenceX基准测试系统数据，在等效质量下，AI推理成本每年下降约60倍 [12] - 每瓦智能（intelligence per watt）的年改善幅度约为40倍，略低于成本降幅，部分效率提升来自非功耗环节 [12] - InferenceX系统已获得超过5000万美元的硬件捐赠，每日在超过15种不同芯片类型上对最新模型进行实时测试 [12] 行业研究方法论 - InferenceX的核心输出是“帕累托最优曲线”，该曲线在响应延迟与批处理吞吐量之间找到每个场景的最优配置点，并将配置开源 [12] - 这条曲线是硬件、基础设施、模型和应用层所有决策的上游依据，商业化案例如Anthropic的Claude Code快速模式和OpenAI的优先队列 [12]