Grace Blackwell NVL72
搜索文档
英伟达加速拥抱光芯片
半导体行业观察· 2026-04-06 10:14
文章核心观点 - 英伟达计划在2028年前利用光子互连技术,将超过一千个GPU集成到一个巨型系统中,以突破当前铜互连的物理限制,构建更庞大的人工智能计算集群 [1] - 为实现这一目标,英伟达正积极投资并布局光学和互连技术供应链,包括向Marvell、Coherent和Lumentum等公司投资数十亿美元,为未来系统的广泛部署奠定基础 [1][11] - 公司的技术路线图显示,其互连策略正从依赖铜缆和可插拔光模块,向结合共封装光学(CPO)等先进技术演进,以解决功耗、带宽和扩展距离问题 [4][6][8] 英伟达的互连技术演进与挑战 - 2022年底,面对ChatGPT等大模型需要数千个GPU进行训练的需求,英伟达意识到其当时最强大的系统(仅8个GPU)和网络速度已无法满足,需要更大的处理器或更快的网络 [1] - 2024年GTC大会发布的Grace Blackwell NVL72是一个功率达120千瓦的巨型机器,采用铜质背板连接36个节点和72个GPU,实现了1.8 TB/s的传输速率,但铜线信号衰减限制了其传输距离仅为几英尺 [2] - 铜线的距离局限性迫使英伟达必须将尽可能多的GPU塞进单个机架,而公司正迅速接近铜的物理极限,需要采用光学技术来组装更大的GPU系统 [2] 从可插拔光模块到共封装光学(CPO)的转变 - 在NVL72机架设计初期,连接加速器的商业可行方法是使用可插拔光学模块,但为达到1.8 TB/s带宽,每块Blackwell GPU需要18个800 Gbps模块,导致72块GPU总功耗额外增加约20,000瓦 [4] - 2025年,英伟达成为首批将CPO技术集成到Spectrum以太网和Quantum InfiniBand交换机中的AI基础设施提供商之一,这显著减少了构建AI训练集群所需的可插拔组件数量 [5] - CPO技术将光引擎直接集成到交换机ASIC旁,有助于降低功耗,但直到最近,公司才开始探讨在其核心的NVSwitch架构中使用光模块和CPO [4][5] 下一代系统:Vera Rubin与Feynman的光学扩展 - 在2026年GTC大会上,英伟达推出了Vera Rubin NVL576和Rosa Feynman NVL1152多机架系统,计划利用光子学将计算域扩展八倍 [6] - Vera Rubin NVL576将采用铜和光纤互连的组合,网络第一层(机架内)使用铜缆,第二层主干网将采用可插拔光模块 [6] - 预计于2028年中后期出货的Feynman一代系统将提供铜缆或共封装光纤NVLink互连两种选择,公司可能将CPO集成到NVLink交换机ASIC或甚至GPU封装中,以简化网络架构、降低延迟 [8][9] 供应链投资与战略布局 - 为保障未来光学互连所需的核心组件供应,英伟达在过去一个月向光学激光器公司Coherent和Lumentum分别投资20亿美元,总计40亿美元 [11] - 公司还与Marvell达成一项20亿美元的合作协议,合作内容包括将NVLink Fusion技术集成到定制XPU中,以及共同开发光纤I/O技术 [11] - Marvell以32.5亿美元收购Celestial AI的交易可能与此相关,后者的光子互连技术可用于构建跨机架的相干存储网络,这对英伟达及其大客户(如AWS)具有吸引力 [11][12]
黄仁勋:希望特朗普帮帮忙
半导体芯闻· 2025-10-29 18:40
公司技术产品与合作 - 公司在技术大会上重点介绍了其最先进的人工智能芯片Blackwell GPU,并盛赞其计算能力 [1] - 公司展示了Grace Blackwell NVL72服务器,单个机架集成72块GPU,重量达3000磅(约1361公斤),售价数百万美元 [1] - 公司去年推出的Blackwell芯片迄今已出货600万片,未来五个季度还接到1400万片订单,总销售额相当于5000亿美元 [1] - 公司与优步、路西德汽车等公司合作加速自动驾驶汽车的推出,并与制药商礼来合作打造用于药物研发的超级计算机 [3] - 公司与诺基亚合作将人工智能整合到6G无线网络中,并将向诺基亚投资10亿美元 [3] - 公司与众多企业合作提升采用其芯片的数据中心的能源效率 [4] 生产与供应链 - 公司强调其强大的“思考机器”核心组件主要产自美国工厂,并已在美国亚利桑那州实现Blackwell芯片的全面量产 [1] - 公司Blackwell系列芯片采用了台积电的晶圆级系统集成技术,该技术目前仅在台积电最先进工厂具备,台积电正推进将这项先进封装技术引入美国 [2] 行业与市场地位 - 公司在全球人工智能芯片市场占据主导地位 [2] - 公司担忧随着人工智能芯片和软件产量增加,美国会永久失去人工智能技术栈市场,因其过多依赖外国产品 [2] 公司战略与政府关系 - 公司首次在华盛顿举办大型人工智能会议,反映出其正花更多时间游说政府官员 [2] - 公司首席执行官称特朗普是美国在人工智能竞赛中的最大优势,并与特朗普达成协议拟将中国芯片销售额的15%交给美国政府以换取出口许可 [3] - 公司首席执行官赞扬特朗普努力增加电力供应,并指出若无此举措行业可能会陷入困境 [4][5] - 公司首席执行官暗示华盛顿的技术大会未来可能会定期每年举办一次 [5]
英伟达(NVDA):FY26Q1业绩点评及业绩说明会纪要:Blackwell占比已到7成,推理agent、工业AI、主权AI开启算力新投资时代
华创证券· 2025-05-31 15:49
报告公司投资评级 未提及 报告的核心观点 2025年5月29日英伟达发布FY2026Q1报告并召开业绩说明会,该季度营收显著高于市场预期和公司指引,主要受益于数据中心业务爆发,虽H20产生费用且预计二季度有收入损失,但各业务表现良好,公司预计FY26Q2营收及毛利率可观,且AI处于发展早期阶段,多领域有广阔应用前景 [2][3][5] 根据相关目录分别进行总结 NVIDIA FY2026Q1业绩概况 - FY26Q1营收441亿美元,同比增长69%,环比增长12%,高于市场预期和公司指引,主要因数据中心业务爆发,Blackwell贡献数据中心计算收入7成,H20一季度产生45亿美元费用,预计二季度损失80亿美元收入 [3][7] - FY26Q1,GAAP和非GAAP毛利率分别为60.5%和61.0%,不计45亿美元费用,第一季度非GAAP毛利率达71.3%;GAAP和非GAAP稀释每股收益分别为0.76美元和0.81美元,不计相关费用及税费影响,第一季度非GAAP稀释每股收益为0.96美元 [3][7] - 供应链管理优化,存货周转天数59天,环比下降27天,待交付金额298亿美元,环比下降3%,预付采购41亿美元,环比下降17.6% [7] - 公司预计FY26Q2营业收入为450亿美元,上下浮动2%,考虑H20收入损失约80亿美元;预计GAAP和非GAAP毛利率分别为71.8%和72.0%,上下浮动50个基点,力争下半年将毛利率提高到70%左右 [5][8] 细分业务情况 - 数据中心:FY26Q1营收创历史新高,达391亿美元,环比增长10%,同比增长73%,其中计算营收342亿美元,同比增长76%,环比增长5%,网络营收49.57亿美元,同比增长56%,环比增长64%,Blackwell GPU产能爬坡快,贡献近70%的数据中心计算营收,从Hopper的转型接近完成 [4] - 游戏:FY26Q1收入为37.63亿美元,环比增长48%,同比增长42%,Blackwell架构显卡产能爬坡快 [4] - 专业可视化:FY26Q1收入为5.09亿美元,环比几乎持平,同比增长19%,关税影响一季度系统和需求,AI工作站需求强劲,预计二季度营收环比增长 [4] - 汽车和机器人:FY26Q1收入为5.67亿美元,环比下降1%,同比增长72%,由自动驾驶产能爬坡和新能源汽车终端需求推动 [4] 会议内容(问答环节) - 关于推理需求,Grace Blackwell NVL72是推理AI理想引擎,与Hopper相比,速度和吞吐量高出约40倍,可降低成本、提高响应质量和服务质量 [9] - H20第一季度确认46亿美元营收,未出货25亿美元,二季度中国数据中心营收将大幅下降,预计损失80亿美元,未来还有其他订单无法履行,估计未来该市场规模接近500亿美元 [10][11] - AI处于起步阶段,将改变各行业,推理成为计算工作负载重要组成部分,除云端,AI将进入企业、电信、工厂等领域 [12][13] - 目前订单增多,供应链正在建设,欧洲有大量AI工厂正在规划和建设 [14][15] - H20二季度损失80亿美元,非中国业务表现好于预期,因Blackwell增长和供应链供应增加 [16] - 推理AI需求增长、AI扩散、企业AI和工业AI发展带来积极影响,推理AI突破障碍,AI扩散创造机会,企业AI准备腾飞,工业AI与新工厂建设契合 [17][18] - 出口管制对Hopper限制大,目前无适合中国市场的产品,正在思考解决方案 [20] - 网络业务有NVLink、Spectrum - X、Bluefield等平台,增强以太网功能,提高集群利用率,上个季度增加两家重要CSP采用SpectrumX [21]
英伟达(NVDA.US)FY26Q1业绩会:预计H20限售将造成二季度80亿美元损失
智通财经网· 2025-05-29 11:10
财务表现与业务增长 - 英伟达第一财季整体营收同比增长69%至440亿美元 数据中心业务收入同比增长73%至390亿美元 [1] - 第一季度确认46亿美元H20收入 但有25亿美元出货未完成 计提45亿美元减值反映未来订单无法兑现 [1][3] - 预计第二季度总收入为450亿美元(±2%) 受H20出口限制影响将减少80亿美元收入 [1][8] - 与Hopper相比 Grace Blackwell NVL72在推理性能上提升40倍 已进入全面量产阶段 [2][14] 中国市场影响 - 中国是全球最大AI市场之一 全球50%AI研究人员在中国 出口管制将增强中国芯片商国际竞争力 [1] - 评估未来无法覆盖的中国市场规模接近500亿美元 目前没有适用产品 [3] - 旧政策下中国季度出货量约70-80亿美元 新限制使Hopper降级方案难以有效使用 [11] AI行业趋势与战略布局 - AI进入推理能力时代 推理型AI智能体对算力需求比一次性问答高数百至数千倍 [5][7][14] - AI将成为电力/互联网级别的基础设施 全球正规划数百座AI工厂 目前约100座在建 [6][7][15] - 企业AI进入爆发期 RTX Pro Enterprise AI服务器可运行全企业级工作负载 [5][9][10] - 工业AI成为第四大支柱 新工厂将配备AI工厂 Omniverse和机器人技术加速应用 [10][15] 产品与技术进展 - 网络业务形成四大平台:NVLink纵向扩展 Spectrum-X以太网优化 InfiniBand Bluefield控制平面 [12][13] - Spectrum-X使以太网利用率从50%提升至85-90% 新增两家云服务提供商采用 [12][13] - Blackwell设计覆盖AI全生命周期 支持从训练到复杂推理与智能体部署 [14] 供应链与订单情况 - Blackwell订单量超GTC会议时水平 供应链持续扩充产能 美国本土产能建设加速 [7] - 主权云和企业AI需求超预期 抵消部分中国市场损失 支撑450亿美元营收目标 [8][9]
英伟达,巨头转型
半导体芯闻· 2025-05-19 18:04
核心观点 - 英伟达从GPU芯片厂商转型为AI基础设施巨头,通过CUDA生态和硬件创新引领加速计算与AI革命 [3][4][29] - 公司提出"AI工厂"概念,将数据中心视为生产token的价值创造中心,类比工业革命的电力和信息时代的互联网 [5] - 台湾供应链在英伟达全球版图中占据核心地位,从晶圆制造到系统组装形成完整产业链 [24][26][27] 技术演进路径 - **GPU到AI平台**:2006年推出CUDA改变并行运算,2016年推出DGX系统开启AI革命,2019年收购Mellanox强化数据中心网络能力 [3][4] - **计算范式突破**:从感知AI(图像/语音)到生成式AI(内容创作),再向代理式AI(任务执行)和物理AI(理解现实规律)演进 [14][16] - **硬件性能跃迁**:GB300单节点算力达40 PFLOPS,相当于2018年18,000块Volta GPU组成的Sierra超算,6年性能提升4,000倍 [17][18] 核心竞争优势 - **CUDA生态**:覆盖计算光刻(cuLitho)、量子化学(cuQuantum)、气候模拟(Earth-2)等20+行业,形成"库越多→应用越丰富→用户越多"的飞轮 [9][10] - **异构计算架构**:通过NVLink实现7.2TB/s单机带宽,130TB/s集群带宽,超越全球互联网流量 [20] - **制程与封装**:台积电CoWoS-L封装技术集成32颗GPU裸片+128组HBM,单芯片含2,000亿晶体管 [26] 产品路线图 - **GeForce 5060 RTX**:展示DLSS神经渲染技术,90%像素靠AI生成,实现光线追踪性能飞跃 [6] - **Grace Blackwell NVL72**:横向扩展数百台服务器,纵向突破半导体物理极限,Q3将推出GB300升级版,推理性能提升1.5倍 [17] - **三位一体平台**:集成CPU/GPU/QPU,CUDA Q实现量子误差处理,5G/6G网络全加速重构 [12] 台湾产业链协同 - **制造环节**:台积电负责12英寸晶圆前道工艺,Amkor完成CoWoS异质封装,京元电子进行125℃高温测试 [26] - **系统集成**:鸿海精密组装10,000+组件,整合液冷散热器(酷码/奇鋐)、ConnectX-7网卡等 [27] - **超级计算机**:120万组件/2英里铜缆/1,300万亿晶体管/1.8吨重量,体现台湾半导体全链条能力 [27]