纪要涉及的公司 英伟达、亚马逊、超微电脑、戴尔、Lambda、Meta、特斯拉 纪要提到的核心观点和论据 - GB200 相关情况 - 出货时间:GB200 从 2024 年 Q4 推迟到 2025 年 Q1,大部分产品 2025 年 1 月开始出货,部分产品争取 2024 年 Q4 推出;DGX - GB200 出货时间与 GB200 相近或稍早;HGX - B200 英伟达未明确说明先推出 DGX 还是 HGX [1] - 部署时间:部分 hyperscalers 计划 2025 年 Q1 末(3 月)部署,保守预计 Q2(4 月) [3] - 出货量预估:GB200 在使用 CoWoS 工艺中芯片接合良率问题致产率可能仅为计划 60%;B200 可能取消或仅有极少量供应给 Meta 或特斯拉等非 CSP 的 hyperscaler;CSPs 从 H100 直接过渡到 GB200 或致出货缓慢 [3] - 存在问题:可能存在 rack 方面问题,不确定与服务器机箱、电力还是液冷有关,未听说芯片级别问题 [2] - H100 相关情况 - 价格趋势:H100 服务器价格可能略微下降,超微库存或大于预期需降价减库存,戴尔进入市场晚但已追赶上来,竞标中报价比超微低 [5] - 毛利率:超微 H100 早期毛利率 15 - 20%,随竞争利润率下降,但总体仍高于 10%,大规模订单(4000 颗甚至 8000 颗芯片)利润率可能低于 10% [5] - 库存与销售:未听说英伟达卖出更多 Hopper 卡情况,第一梯队 CSP 厂商可能获显著折扣;不确定超微库存多是需求放缓还是竞争加剧导致,其可能损失 H100 早期市场份额 [3][4][5] - 其他芯片时间线 - B200A 预计 2025 年 10 月左右 Lambda 使用,英伟达 2025 年第二季度末或第三季度初为大客户提供 - GB210、GB210A、B210A 预计 2026 年第一季度出货 - Rubin 预计 2026 年第三季度或第四季度出货,2026 年下半年部署 [5] - B210A 新产品情况 - 性能特点:配备单个 Blackwell 芯片的风冷机架设计,晶体管数量减半,内存容量和带宽与 B200A 相同,NVLink 域增加到 64 个,去除 FP64 并增加 FP4 Tensor Core,针对特定使用场景,在 FP4 Tensor Core 工作负载上表现出色 [6] - 市场情况:可能与其他芯片产品抢份额,2026 年 Q1 同时推出三款产品不合理,猜测其中一款可能取消;命名为“A”系列可能因是风冷,英伟达确保未来 Blackwell 有足够风冷芯片 [6] 其他重要但是可能被忽略的内容 - 亚马逊和英伟达合作的 Project Ceiba 采用 DGX Cloud 的 AI 超级计算机,搭载 20736 颗 GB200 芯片,不确定是 DGX 还是仅芯片,猜测可能是芯片 [1] - Lambda 与超微电脑关系密切,超微电脑投资了 Lambda [4] - 戴尔将砍掉 15000 或 12500 个工作岗位,主要是销售和市场部门,表现可能不如预期,利润率不如超微健康 [5]
hedjif-7
-·2024-08-13 22:21