H200需求强劲,还没获批
半导体芯闻·2026-01-06 18:30

英伟达H200芯片在华销售进展 - 公司确认其H200芯片在中国市场需求强劲,但销售需等待美国和中国政府的批准[1] - 公司已向美国政府提交出口许可证申请,此前特朗普政府表示将允许其向中国出售Hopper 200芯片,条件是将25%的销售额上缴美国政府[1] - 作为向中国出售降级版H20芯片的交换条件,公司于8月份同意向美国政府支付销售收入的15%[1] - 中国政府于9月份指控公司违反反垄断法,导致其在中国市场份额从95%暴跌至零[2] - 美国政府正在研究如何处理不同的许可证,且“所有不同政府之间的团结一致”是开始发货的必要条件[2] - 北京方面是否批准销售以及批准多少数量,是公司能否向中国出口H200s的另一关键决定因素[2] - 野村证券分析师认为北京可能会批准H200销售,但可能附加类似配额制的条件,例如要求企业在购买H200时需同时购买一定数量的国产芯片[2] 下一代Rubin AI芯片发布与性能 - 公司在CES 2026上宣布其下一代Rubin AI芯片已“全面投产”,并将于2026年下半年上市[4] - Rubin GPU的推理计算性能是Blackwell的5倍,训练计算性能是Blackwell的3.5倍[5] - 与Blackwell相比,Rubin能降低训练和推理成本,推理令牌成本最多可降低10倍[5] - Rubin架构包含3360亿个晶体管,在处理NVFP4数据时可提供50 petaflops的性能,而Blackwell最高为10 petaflops[5] - Rubin的训练速度提升了250%,达到35 petaflops[5] - Rubin将成为首款集成HBM4内存的GPU,数据传输速度高达每秒22 TB,比Blackwell有显著提升[6] - 微软Azure和CoreWeave将成为首批在2026年下半年提供由Rubin驱动的云计算服务的公司之一[7] Vera Rubin AI超级计算机与系统架构 - 公司发布了下一代AI数据中心机架级架构Vera Rubin,由六种芯片协同设计而成:Vera CPU、Rubin GPU、NVLink 6交换机、ConnectX-9 SuperNIC、BlueField-4 DPU和Spectrum-6以太网交换机[10] - 每个Rubin GPU配备8个HBM4显存堆栈,提供288GB容量和22 TB/s带宽[11] - Vera Rubin推出NVLink 6,将每个GPU的交换矩阵带宽提升至3.6 TB/s(双向)[12] - 每个NVLink 6交换机拥有28 TB/s带宽,每个Vera Rubin NVL72机架配备9个这样的交换机,总纵向扩展带宽可达260 TB/s[12] - Nvidia Vera CPU采用88个定制的Olympus Arm核心,支持“空间多线程”技术,可同时运行多达176个线程[12] - 用于连接Vera CPU与Rubin GPU的NVLink C2C互连带宽翻倍,达到1.8 TB/s[12] - 每个Vera CPU可寻址高达1.5 TB的SOCAMM LPDDR5X内存,内存带宽高达1.2 TB/s[12] - 公司发布了“DGX SuperPOD with DGX Vera Rubin NVL72”,这是一款由八块Vera Rubin NVL72 GPU组成的扩展型超级计算机,可使用256个Vera CPU和512个Rubin GPU[20] 公司战略与市场预期 - 首席执行官黄仁勋表示,即使没有中国或其他亚洲市场,公司预计到2026年,其最先进的Blackwell AI芯片和Rubin的“早期产能提升”也将带来5000亿美元的收入[8] - 公司认为人工智能的未来将主要体现在物理世界中,并在CES 2026期间宣布与比亚迪、LG电子和波士顿动力公司等制造商、机器人制造商和汽车制造商达成合作[8] - 黄仁勋表示“机器人领域的ChatGPT时刻已经到来”,物理人工智能的突破正在解锁全新应用[9] - 投资公司Inno Chip的合伙人认为,如果英伟达的H200处理器开始在中国销售,短期内会对中国芯片制造商造成冲击,因为企业往往会选择更成熟的技术[2] - 公司表示,鉴于市场对Vera-Rubin架构的热情,选择在CES上提前推出该产品[7] 行业挑战与供应链问题 - 整个行业正陷入零部件短缺困境,公司宣布其2026年CES主题演讲将“不会发布任何新的GPU”,打破了连续五年在CES上发布新款GPU的惯例[21] - DRAM短缺可能导致了此次发布计划的搁浅,甚至有传言称公司将重启RTX 3060的生产[22] - 全球只有美光、SK海力士和三星三家公司能够生产尖端DRAM,且它们都乐于将产品卖给AI客户以获取更高利润[23] - 对通用人工智能(AGI)的渴求促使公司制定了突破性的计算目标,这些目标超出了现有供应链的承载能力[23] - 地缘政治因素使情况复杂化,因为前沿人工智能代表着另一场军备竞赛[23]