文章核心观点 - 英伟达战略重心从自建云服务DGX Cloud转向平台化算力调度市场Lepton 以化解与云巨头的渠道冲突并掌控AI算力生态入口 [6][11][23] - 公司通过"卖芯片-投资客户-租回服务"模式构建自循环资金链 强化生态黏性并稳定市场价格预期 [13][17][18] - Lepton平台通过聚合跨云算力资源并统一软件栈 试图成为AI算力领域的"App Store" 掌握分配权与数据洞察能力 [21][26][27] 战略转型 - 2023年推出的DGX Cloud月租达36999美元 2024年底其所属的软件与服务收入达20亿美元年化规模 [6][8] - 2024年下半年云厂商大幅降价 AWS对H100和A100实例降价45% 导致DGX Cloud价格优势消失 [8] - 2025年公司不再将数十亿美元云支出承诺对齐DGX Cloud 其角色转为内部基础设施与研发用途 [6][11] - 2025年5月新上线Lepton平台 转型为算力调度市场 避免与AWS/Azure/GCP等云厂商直接竞争 [6][11][23] 生态构建模式 - 投资云服务商并优先供货:2023年向CoreWeave投资1亿美元并优先供应H100 GPU [13] - 租回算力协议:2025年9月与Lambda签订4年15亿美元租赁协议 租用1万台搭载自家GPU的服务器 [15] - 形成资金闭环:芯片销售即时确认收入 租赁支出分期摊销 最小化资产压力 [17] - 通过Nventures投资AI初创公司 绑定潜在算力需求客户 构建创业孵化器生态 [19] Lepton平台特性 - 不直接持有GPU库存 作为需求分发平台连接开发者与云服务商(包括AWS/Azure/CoreWeave等) [11][21] - 整合英伟达软件栈(NIM微服务/NeMo框架) 提供一致开发体验 [22] - 获得AWS和Azure等云巨头支持 通过平台接触额外算力需求 [23] - 实时观测算力任务类型、地域分布、GPU使用频率及价格弹性 辅助商业决策 [26] 市场影响 - 缓解渠道冲突:从直接竞争转为中立调度方 维持与云巨头的芯片销售合作关系 [11][23] - 锚定算力价格:英伟达回租行为变相为AI算力行情背书 稳定市场预期 [18] - 掌控价值链:无论客户选择哪家云服务商 最终依赖英伟达GPU和软件栈 [29] - 潜在挑战:中小云厂商担心客户关系与定价权被影响 推广仍需过程 [26]
我们还是低估了英伟达