Workflow
Groq 3 LPX机架
icon
搜索文档
英伟达发布!黄仁勋:1万亿美元营收
中国证券报· 2026-03-17 10:43
公司业绩与市场展望 - 公司CEO预测,到2027年算力芯片的市场需求将达到1万亿美元,而上一年的预测是2026年需求约5000亿美元 [2] - 公司CEO表示,公司约60%的业务来自超大规模云厂商,40%来自云服务、企业客户、机器人等其他领域 [4] - 公司CEO认为,AI产业经历了从“感知”到“生成”,再到“推理”、“执行”的演进,并指出推理拐点已经到来,Token生成需求呈爆炸式增长 [2] 产品与技术进展:Vera Rubin平台 - 公司展示了Vera Rubin平台,这是一个由7款芯片、五种机架系统组成的巨型超级计算平台,旨在扩展全球最大AI工厂的规模,且7款新芯片现已全面投产 [6] - Vera Rubin NVL72集成了72个Rubin GPU和36个Vera CPU,与Blackwell平台相比,仅需四分之一数量的GPU即可训练大型混合专家模型,每瓦特推理吞吐量最高可提升10倍,同时每Token成本仅为原平台的十分之一 [6] - 公司发布了全新的Vera CPU机架,集成256个液冷Vera CPU,AI工厂可在单个机架内快速扩展至数万个并发实例和智能体工具,效率比传统机架级CPU提升一倍,速度提升50% [6] 产品与技术进展:Groq 3 LPX与Spectrum-6 - 公司介绍了Groq 3 LPX机架,专为智能体系统的低延迟和长上下文需求设计,整套LPX机架包括256个LPU处理器,配备128GB片上SRAM和640TB/s的纵向扩展带宽 [7] - 当LPX与Vera Rubin NVL72协同部署时,Rubin GPU和LPU通过协同计算AI模型的每一层来生成每一个Token,使得每兆瓦的推理吞吐量提升高达35倍 [7] - 公司介绍了Spectrum-6 SPX交换机,采用共封装光学技术,相比传统可插拔收发器,其光学能效最高提升5倍,系统可靠性提高10倍 [7] 产品与技术进展:其他发布 - 公司推出了用于太空数据中心的Vera Rubin模块,并宣布将推出新一代AI图形技术DLSS 5,可为游戏画面实现更真实的光照和材质效果,预计今年秋季上线 [8] - 公司宣布推出NemoClaw,定位为OpenClaw智能体平台的基础设施层,可通过“一条命令”部署AI代理,并集成Nemotron模型和OpenShell运行环境,补齐安全、隐私与沙箱能力 [9] - 公司宣布成立“Nemotron联盟”,联合多家全球AI实验室共同开发开放式前沿基础模型,同时发布开源智能体软件套件,为企业和开发者提供构建与运行AI智能体的软件平台 [9] 行业观点与竞争定位 - 公司CEO认为,过去三年AI产业的3个里程碑式产品分别是ChatGPT、OpenAI的o1推理模型,以及Claude Code智能体,它们分别开启了生成式AI时代、实现了模型的反思与规划能力、革新了软件工程 [2] - 公司CEO在演讲中提出“每瓦Token数”的概念,并表示公司的Token成本目前是全球最低的 [2] - 公司CEO表示,公司与OpenClaw开发者以及专家们合作,打造了一整套智能体AI工具链,确保AI代理在公司内部执行任务时是安全的 [9]
5分钟速览黄仁勋最新演讲
财联社· 2026-03-17 08:09
公司财务与市场预期 - 公司CEO确认,其旗舰芯片将帮助公司在2027年创造1万亿美元的营收[4] - 此前公司对数据中心设备销售额的展望为2026年底达5000亿美元,最新预测将时间延长一年至2027年,且累积金额翻倍至1万亿美元[6] - 该财务预期发布后,公司股价盘中最高上涨超4%,最终收盘上涨1.6%[7] 新产品与平台战略 - 公司强调其Vera Rubin并非单一芯片,而是由7种芯片和5种机架系统组成的完整AI超级计算机平台[8] - 新发布的Vera CPU机架单机架集成256颗CPU,与传统CPU相比,计算效率提升2倍,运行速度提升50%[10] - Groq 3 LPX机架搭载256个LPU处理器,提供128GB片上SRAM和640TB/s扩展带宽,与Vera Rubin平台结合后,推理吞吐量/功耗比将提升35倍[10] - 公司推出的Spectrum-6 SPX采用了共封装光学技术,带来5倍更高光功率效率和10倍更高网络可靠性[13] - 公司推出Space-1 Vera Rubin模块,将数据中心级AI计算能力部署到卫星和轨道数据中心,面向在轨推理、实时地理空间智能等任务[16] - 公司产品组合形成从轨道边缘计算到地面AI数据中心再到云端分析的完整算力架构[18] 技术路线与生产规划 - LPU芯片将由三星代工,预计相关机架将于今年下半年开始出货[10] - 公司发布的三款新机架均采用液冷架构[12] - 未来的Rubin Ultra在Kyber机架中将采用垂直插入排列,使单个NVLink域中可连接144块GPU[15] - 下一代费曼架构GPU将采用堆叠芯片和定制HBM技术[15] 软件与生态系统 - 公司通过NemoClaw进军AI智能体基础设施赛道,其定位为OpenClaw智能体平台的基础设施层,可通过“一条命令”部署AI代理[19] - NemoClaw可运行在从RTX PC到DGX Spark等多种设备上,旨在推动“始终在线的AI助手”需要专用计算设备[19] - 公司宣布进一步扩展其“开放模型体系”,重点覆盖智能体AI、物理AI和医疗AI三大领域[19] 图形技术突破 - 公司在GTC大会上发布DLSS 5,并称这是自2018年实时光线追踪推出以来,在计算机图形领域最重要的一次突破[20] - 公司CEO将DLSS 5描述为图形领域的“GPT时刻”,该系统将传统3D图形数据与生成式AI模型结合,通过预测和补全图像内容来提升渲染效率[21]