算力租赁产业交流
英伟达英伟达(US:NVDA)2026-04-20 22:01

行业与公司 * 行业:算力租赁产业,涉及AI服务器、GPU、数据中心、云服务[1] * 公司:提及的云厂商包括阿里云、腾讯云、字节跳动、百度(BAT)[4][6][9];提及的AI大模型公司包括智谱AI、MiniMax、月之暗面[10];提及的GPU供应商为英伟达(NVIDIA)及国产GPU厂商[1][3][12][13] 核心观点与论据 市场供需与价格趋势 * 算力租赁价格上涨趋势预计至少持续至2026年,核心驱动力是英伟达高端GPU(A/H/B/GB系列)供需严重失衡及中美贸易限制[1][3] * 2026年以来,头部互联网厂商AI算力投入加速,单体项目规模较2025年同期增长至少两到三倍[2] * 价格上涨具体表现为:H100等服务器旧合同到期后转为涨价并以价高者得模式出租,短租趋势更明显[2];BAT等大厂支付的H100月租金从7.5-8.5万元提升至9-9.5万元[9] * 供给短缺局面难以改变,因市场主流应用高度依赖英伟达生态,国产GPU两年内无法大规模有效替代[3] * 长期来看,算力租赁价格必然下降,国产算力生态发展及企业降本增效需求将驱动价格下行[20][21] 商业模式与客户结构 * 国内算力租赁主流模式分化:资金充裕的大厂和头部AI公司自持算力用于核心训练;资金不足的创业公司80%以上算力来自租赁;对外提供算力服务的企业则几乎100%通过租赁获得[6] * 业务模式呈现两极分化:一是服务资金雄厚的头部大客户(如大型互联网厂商),模式清晰稳定;二是避开大厂,深耕细分市场(如整合区域中小企业零散需求、专攻教育科研市场)[11] * 存在显著的中间商壁垒:至少三分之二的算力交易中,中间商截取利润,导致终端价格上涨10%仅能带动持有方净利率增长2%-3%[1][9] * 客户高度集中:大规模采购算力的客户高度集中于约十家头部公司[10] * 海外市场差异:美国由头部企业主导;"一带一路"国家多由中国企业提供算力解决方案,以换取当地资源[5] 成本效益与投资决策 * 企业选择公有云租赁与自建算力的性价比平衡点约为年IT成本3,000万元:低于此值云租赁合理,高于此值自建更经济[1][7] * 选择依据核心用途:对外提供经营性服务适合云租赁以快速弹性扩容;内部研发或优化生产流程则自建更具成本效益[7] * AI服务器残值远超预期:H100三年后残值预计达50%-60%,远高于传统CPU服务器的15%及早期预期的40%[1][7][8] * 高残值及租赁市场火爆导致设备持有方不愿出售,二手市场货源稀缺[8] * 算力成本结构变化:高昂的GPU投入(是传统CPU服务器的8到10倍)稀释了电力成本占比,使其在总成本中降至10%-15%,客户对电价敏感度下降[1][17] * 客户更关注机柜电力密度、数据中心规模(如能否支持100兆瓦以上万卡集群)及位置是否贴近核心用户[17] 国产GPU发展与政策影响 * 国产GPU在租赁市场的发展主要由政策强制驱动,预计两年内有望抢占三分之一市场份额[1][14] * 政府通过限制英伟达GPU进口、在数据中心能耗指标审批中强制配置国产算力、将使用国产算力与其他政策支持挂钩等方式,倒逼企业进行国产化适配与生态建设[12][13][18] * 从2026年开始,一线城市对英伟达GPU的算力补贴已基本全面停止,补贴力度明显退坡[12] * 国产算力实际应用挑战大:企业因投入成本高、适配麻烦(如需要更高薪的研发人员调优)而不愿使用;目前真实规模化应用集中在有资金和科研能力的头部公司,部分与融资条件绑定[13] * 政府限制进口变相制造了商业算力短缺,旨在为国产算力产业创造发展空间[18] * H100等高端GPU目前基本无法通过常规渠道进入中国,仅特殊涉密研发项目可获准进口,这为国产卡创造了巨大市场机会[19] 设备与合同细节 * 主流租赁型号及月租金(八卡服务器):A100/A800约4万元;H100/H800/H200一年期整租约7-7.5万元,短租(≤3-6个月)约8-9万元;B200预估至少12-13万元(无零售订单)[14] * 采购价格:H100/H200八卡服务器约210-220万元;B200价格混乱,香港拿货价最低380万元,国内成交价高达460-470万元[15] * 合同与折旧变化:GPU集群签约周期从3年普遍延长至5年,设备折旧周期按3至5年计算[15] * 早期采购成本:2024年H100服务器售价250-280万元(含多层中转成本),当前二手回收价170-180万元(相当于当时出厂价八折到八五折)[7] * 算力持有方净利率:考虑政府补贴和超低息贷款,项目净利率约10%-15%,毛利率约20%-25%[8] * 租赁商主要成本:除折旧外,需承担设备维修费及为保障连续性而准备的备机成本(如千卡集群需备3-10台新机)[16] 其他重要内容 * 云厂商定价策略:利用紧张GPU算力资源作为杠杆,以优先分配算力为条件,促使年消费额在1,000万以内的中等体量用户接受原有云服务涨价[1][4] * 头部厂商算力布局:2025年前,字节跳动存量算力最大且重资产在东南亚,阿里在国内和东南亚均有布局(国内占比较大);2026年字节开始重点布局国内市场[6] * 技术演进影响:AI服务器追求更高算力密度(如从8卡发展到16卡、32卡),推动光模块(CPO)等互联配套设施需求成倍增长,但对传统服务器市场影响不大[9] * 算力需求驱动:AI应用对Token消耗的爆发式增长及中小企业全面拥抱AI研发[2] * 行业政策:工信部对过度"内卷"和价格战的指导也是云服务价格回升的因素之一[4] * 长期生态展望:国产厂商正发展以Token计费的服务模式,致力于构建互联互通的"算力工厂"生态[20]

算力租赁产业交流 - Reportify