一文读懂英伟达GTC：有关Blackwell全家桶、硅光芯片和黄仁勋的“新故事”

英伟达GTC 2025大会核心要点硬件产品线更新 - 推出Blackwell Ultra GPU，采用台积电N4P工艺，搭配HBM3e内存显存提升至288GB，FP4精度算力达15PetaFLOPS，推理速度比Hopper架构提升2.5倍 [8][11] - 发布Blackwell Ultra NVL72机柜，含72颗GPU+36颗Grace CPU，显存20TB，总带宽576TB/s，推理性能比H100提升50倍，6710亿参数模型推理速度达每秒1000 tokens [13][14][16] - 预告2026年Rubin架构GPU及Vera Rubin NVL144机柜，FP4精度算力3.6ExaFLOPS，性能是Blackwell Ultra的3.3倍 [16][17] - 推出DGX Super POD超算工厂，含576颗Blackwell Ultra GPU，FP4算力11.5ExaFLOPS，支持生成式AI全流程 [18][22] 软件生态布局 - 推出开源推理加速软件Nvidia Dynamo，可使Llama模型性能翻倍，DeepSeek推理模型token生成提升30倍，支持千级GPU集群扩展 [36][38][41][46] - 发布48B参数Llama Nemotron模型，token吞吐量达Llama 3 70B的5倍，但训练效率低于DeepSeek V3 [47][49][51] - 推出AI Agent开发平台NVIDIA AIQ，集成RAG系统与多Agent工作流，支持企业数据智能分析 [53][54][59][60] 具身智能战略 - 发布世界基础模型Cosmos，含Transfer/Predict/Reason三模块，支持物理世界模拟与行为预测 [64][65][67] - 推出人形机器人基础模型Isaac GR00T N1，采用双系统架构，已应用于1X等头部机器人公司 [68][71] - 构建DGX训练计算机+AGX边缘计算机+Omniverse数据生成计算机的三位一体算力体系 [75][77] 市场数据与趋势 - 2024年美国四大云厂商采购130万颗Hopper芯片，2025年Blackwell GPU采购量预计达360万颗 [6] - 云厂商AWS/Google Cloud/Azure及服务器厂商Dell/HPE等15家制造商将成为Blackwell产品首批客户 [16] - 光电共封模块(CPO)交换机性能提升3.5倍，部署效率提升1.3倍，扩展弹性超10倍 [29][32]