英伟达GTC 2025大会核心要点 硬件产品线更新 - 推出Blackwell Ultra GPU,采用台积电N4P工艺,搭配HBM3e内存显存提升至288GB,FP4精度算力达15PetaFLOPS,推理速度比Hopper架构提升2.5倍 [8][11] - 发布Blackwell Ultra NVL72机柜,含72颗GPU+36颗Grace CPU,显存20TB,总带宽576TB/s,推理性能比H100提升50倍,6710亿参数模型推理速度达每秒1000 tokens [13][14][16] - 预告2026年Rubin架构GPU及Vera Rubin NVL144机柜,FP4精度算力3.6ExaFLOPS,性能是Blackwell Ultra的3.3倍 [16][17] - 推出DGX Super POD超算工厂,含576颗Blackwell Ultra GPU,FP4算力11.5ExaFLOPS,支持生成式AI全流程 [18][22] 软件生态布局 - 推出开源推理加速软件Nvidia Dynamo,可使Llama模型性能翻倍,DeepSeek推理模型token生成提升30倍,支持千级GPU集群扩展 [36][38][41][46] - 发布48B参数Llama Nemotron模型,token吞吐量达Llama 3 70B的5倍,但训练效率低于DeepSeek V3 [47][49][51] - 推出AI Agent开发平台NVIDIA AIQ,集成RAG系统与多Agent工作流,支持企业数据智能分析 [53][54][59][60] 具身智能战略 - 发布世界基础模型Cosmos,含Transfer/Predict/Reason三模块,支持物理世界模拟与行为预测 [64][65][67] - 推出人形机器人基础模型Isaac GR00T N1,采用双系统架构,已应用于1X等头部机器人公司 [68][71] - 构建DGX训练计算机+AGX边缘计算机+Omniverse数据生成计算机的三位一体算力体系 [75][77] 市场数据与趋势 - 2024年美国四大云厂商采购130万颗Hopper芯片,2025年Blackwell GPU采购量预计达360万颗 [6] - 云厂商AWS/Google Cloud/Azure及服务器厂商Dell/HPE等15家制造商将成为Blackwell产品首批客户 [16] - 光电共封模块(CPO)交换机性能提升3.5倍,部署效率提升1.3倍,扩展弹性超10倍 [29][32]
一文读懂英伟达GTC:有关Blackwell全家桶、硅光芯片和黄仁勋的“新故事”