Claude 4.6 Opus
搜索文档
GPU,严重短缺
半导体行业观察· 2026-04-03 09:55
核心观点 - 人工智能应用需求(特别是Claude 4.6 Opus、Claude Code及多智能体工作负载)呈现爆发式增长,导致对高性能GPU计算资源的需求远超供给,引发从GPU租赁到服务器组件全供应链的价格飙升和供应紧张,这一趋势预计将持续并可能加剧 [1][5][9][12] 人工智能需求与市场动态 - Anthropic公司的年度经常性收入(ARR)在一个季度内从90亿美元增长至250亿美元以上,增长近三倍,反映出AI服务需求的急剧扩张 [1] - Claude Code等AI工具在软件开发领域被广泛采用,预计到2026年底将占所有每日代码提交的20%以上,其带来的生产力提升和投资回报(5-10倍)远超使用成本,驱动了强劲的代币消费 [10][12][13] - 多智能体工作负载执行复杂、持续迭代的工作流程,导致代币和计算资源消耗呈抛物线式增长,成为显著的需求驱动因素 [9] - 原生媒体生成平台(如Seedance和Nano Banana)也推动了代币吞吐量的大幅增长 [9] GPU租赁市场供需与价格 - 所有类型GPU的按需租赁容量均已售罄,市场呈现“一租难求”的局面,寻找资源如同购买高价、稀缺的末班机票 [2][5] - H100 GPU一年期租赁合同价格从2025年10月的1.70美元/小时/GPU飙升至2026年3月的2.35美元/小时/GPU,涨幅近40% [1] - 在2026年1月至3月期间,GPU租赁价格持续快速上涨,1月底突破每小时2美元,2月中下旬较1月底上涨15-20%,预计3月底还将环比上涨15-20% [9] - 客户争相以每小时每GPU 14美元的价格购买AWS上的p6-b200竞价型实例,H100实例的续约价格与两三年前合同价持平,部分合同甚至续签至2028年 [5] - 市场上所有到2026年8月至9月上线的计算容量都已被预订一空,Blackwell新部署的交付周期已延长至六七月份 [5] 供应链成本与服务器市场 - AI需求激增推高了整个供应链的产品和服务价格,涉及DRAM、NAND存储器、光纤电缆、数据中心托管和燃气轮机等 [1] - DRAM和NAND内存价格在2026年第一季度出现抛物线式上涨,LPDDR5和DDR5合约价格同比涨幅分别达到约4倍和5倍 [6] - 为应对组件成本快速上涨带来的利润风险,原始设备制造商(OEM)大幅提高AI服务器定价,其涨幅远超组件成本的实际涨幅 [7] - 服务器采购成本上升压缩了项目预期回报,导致部分运营商放缓或放弃部署,使得本应投入使用的服务器被搁置,进一步加剧了租赁市场的紧张 [7] - 以B300液冷机箱物料清单(BoM)为例,其总成本从9月到当前(文章撰写时)上涨了8%,预计到2026年第四季度将上涨14% [8] 行业趋势与预期 - 市场此前普遍预期随着Blackwell架构部署,Hopper(H100/H200)的租赁价格将下降,但实际情况是需求保持稳定甚至增长,价格不降反升 [6] - 开放权重模型(如GLM、Kimi K2.5)的快速普及和推理需求的加速增长,预示着市场将迎来一波持续的计算需求浪潮 [1][6] - GPU租赁价格的上涨很可能进一步推高服务器和组件成本 [13] - 出现了类似“新云贫民窟房东”的现象,即计算资源租用者将集群资源分割并转租出去 [5]