算力租赁产业交流

行业与公司 * 行业：算力租赁产业，涉及AI服务器、GPU、数据中心、云服务[1] * 公司：提及的云厂商包括阿里云、腾讯云、字节跳动、百度（BAT）[4][6][9]；提及的AI大模型公司包括智谱AI、MiniMax、月之暗面[10]；提及的GPU供应商为英伟达（NVIDIA）及国产GPU厂商[1][3][12][13] 核心观点与论据市场供需与价格趋势 * 算力租赁价格上涨趋势预计至少持续至2026年，核心驱动力是英伟达高端GPU（A/H/B/GB系列）供需严重失衡及中美贸易限制[1][3] * 2026年以来，头部互联网厂商AI算力投入加速，单体项目规模较2025年同期增长至少两到三倍[2] * 价格上涨具体表现为：H100等服务器旧合同到期后转为涨价并以价高者得模式出租，短租趋势更明显[2]；BAT等大厂支付的H100月租金从7.5-8.5万元提升至9-9.5万元[9] * 供给短缺局面难以改变，因市场主流应用高度依赖英伟达生态，国产GPU两年内无法大规模有效替代[3] * 长期来看，算力租赁价格必然下降，国产算力生态发展及企业降本增效需求将驱动价格下行[20][21] 商业模式与客户结构 * 国内算力租赁主流模式分化：资金充裕的大厂和头部AI公司自持算力用于核心训练；资金不足的创业公司80%以上算力来自租赁；对外提供算力服务的企业则几乎100%通过租赁获得[6] * 业务模式呈现两极分化：一是服务资金雄厚的头部大客户（如大型互联网厂商），模式清晰稳定；二是避开大厂，深耕细分市场（如整合区域中小企业零散需求、专攻教育科研市场）[11] * 存在显著的中间商壁垒：至少三分之二的算力交易中，中间商截取利润，导致终端价格上涨10%仅能带动持有方净利率增长2%-3%[1][9] * 客户高度集中：大规模采购算力的客户高度集中于约十家头部公司[10] * 海外市场差异：美国由头部企业主导；"一带一路"国家多由中国企业提供算力解决方案，以换取当地资源[5] 成本效益与投资决策 * 企业选择公有云租赁与自建算力的性价比平衡点约为年IT成本3,000万元：低于此值云租赁合理，高于此值自建更经济[1][7] * 选择依据核心用途：对外提供经营性服务适合云租赁以快速弹性扩容；内部研发或优化生产流程则自建更具成本效益[7] * AI服务器残值远超预期：H100三年后残值预计达50%-60%，远高于传统CPU服务器的15%及早期预期的40%[1][7][8] * 高残值及租赁市场火爆导致设备持有方不愿出售，二手市场货源稀缺[8] * 算力成本结构变化：高昂的GPU投入（是传统CPU服务器的8到10倍）稀释了电力成本占比，使其在总成本中降至10%-15%，客户对电价敏感度下降[1][17] * 客户更关注机柜电力密度、数据中心规模（如能否支持100兆瓦以上万卡集群）及位置是否贴近核心用户[17] 国产GPU发展与政策影响 * 国产GPU在租赁市场的发展主要由政策强制驱动，预计两年内有望抢占三分之一市场份额[1][14] * 政府通过限制英伟达GPU进口、在数据中心能耗指标审批中强制配置国产算力、将使用国产算力与其他政策支持挂钩等方式，倒逼企业进行国产化适配与生态建设[12][13][18] * 从2026年开始，一线城市对英伟达GPU的算力补贴已基本全面停止，补贴力度明显退坡[12] * 国产算力实际应用挑战大：企业因投入成本高、适配麻烦（如需要更高薪的研发人员调优）而不愿使用；目前真实规模化应用集中在有资金和科研能力的头部公司，部分与融资条件绑定[13] * 政府限制进口变相制造了商业算力短缺，旨在为国产算力产业创造发展空间[18] * H100等高端GPU目前基本无法通过常规渠道进入中国，仅特殊涉密研发项目可获准进口，这为国产卡创造了巨大市场机会[19] 设备与合同细节 * 主流租赁型号及月租金（八卡服务器）：A100/A800约4万元；H100/H800/H200一年期整租约7-7.5万元，短租（≤3-6个月）约8-9万元；B200预估至少12-13万元（无零售订单）[14] * 采购价格：H100/H200八卡服务器约210-220万元；B200价格混乱，香港拿货价最低380万元，国内成交价高达460-470万元[15] * 合同与折旧变化：GPU集群签约周期从3年普遍延长至5年，设备折旧周期按3至5年计算[15] * 早期采购成本：2024年H100服务器售价250-280万元（含多层中转成本），当前二手回收价170-180万元（相当于当时出厂价八折到八五折）[7] * 算力持有方净利率：考虑政府补贴和超低息贷款，项目净利率约10%-15%，毛利率约20%-25%[8] * 租赁商主要成本：除折旧外，需承担设备维修费及为保障连续性而准备的备机成本（如千卡集群需备3-10台新机）[16] 其他重要内容 * 云厂商定价策略：利用紧张GPU算力资源作为杠杆，以优先分配算力为条件，促使年消费额在1,000万以内的中等体量用户接受原有云服务涨价[1][4] * 头部厂商算力布局：2025年前，字节跳动存量算力最大且重资产在东南亚，阿里在国内和东南亚均有布局（国内占比较大）；2026年字节开始重点布局国内市场[6] * 技术演进影响：AI服务器追求更高算力密度（如从8卡发展到16卡、32卡），推动光模块（CPO）等互联配套设施需求成倍增长，但对传统服务器市场影响不大[9] * 算力需求驱动：AI应用对Token消耗的爆发式增长及中小企业全面拥抱AI研发[2] * 行业政策：工信部对过度"内卷"和价格战的指导也是云服务价格回升的因素之一[4] * 长期生态展望：国产厂商正发展以Token计费的服务模式，致力于构建互联互通的"算力工厂"生态[20]