Workflow
NVIDIA Rubin GPU
icon
搜索文档
NVIDIA Kicks Off the Next Generation of AI With Rubin — Six New Chips, One Incredible AI Supercomputer
Globenewswire· 2026-01-06 06:20
产品发布与核心定位 - NVIDIA于2026年1月5日在CES上正式推出下一代AI平台Rubin,该平台包含六款新芯片,旨在以最低成本构建、部署和保护全球最大、最先进的AI系统,加速AI主流化进程 [2] - Rubin平台通过六款芯片的极端协同设计,大幅缩短训练时间并降低推理token成本,这六款芯片包括NVIDIA Vera CPU、Rubin GPU、NVLink 6 Switch、ConnectX-9 SuperNIC、BlueField-4 DPU和Spectrum-6以太网交换机 [3] - 公司创始人兼CEO黄仁勋表示,Rubin平台在AI训练和推理需求激增的时刻适时推出,凭借每年发布新一代AI超级计算机的节奏和六芯片的极端协同设计,Rubin向AI下一个前沿领域迈出了一大步 [4] 性能突破与技术创新 - 与上一代Blackwell平台相比,Rubin平台将推理token成本降低高达10倍,训练MoE模型所需的GPU数量减少4倍 [5][8] - Rubin平台引入了五项创新技术,包括第六代NVLink互连技术、Transformer Engine、机密计算、RAS Engine以及NVIDIA Vera CPU,这些突破将加速智能体AI、高级推理和大规模专家混合模型推理 [5] - 第六代NVLink技术为大规模MoE模型提供快速无缝的GPU间通信,每个GPU提供3.6TB/s带宽,而Vera Rubin NVL72机架提供260TB/s带宽,超过整个互联网的带宽 [10] - Rubin GPU采用第三代Transformer Engine,具备硬件加速自适应压缩功能,可为AI推理提供50 petaflops的NVFP4计算能力 [20] - Spectrum-X以太网光子共封装光学交换系统为AI应用提供10倍可靠性和5倍正常运行时间,同时实现5倍能效提升 [19] 生态系统与合作伙伴支持 - 全球领先的AI实验室、云服务提供商、计算机制造商和初创公司预计将采用Rubin平台,包括AWS、Anthropic、谷歌、Meta、微软、OpenAI、甲骨文等超过25家行业巨头 [6] - OpenAI CEO Sam Altman表示,智能随算力扩展,Rubin平台有助于持续扩展这一进程,让先进智能惠及所有人 [7] - 微软下一代Fairwater AI超级工厂将采用NVIDIA Vera Rubin NVL72机架级系统,规模将扩展至数十万个NVIDIA Vera Rubin超级芯片 [8] - CoreWeave、AWS、谷歌云、微软和OCI等云提供商将于2026年下半年率先部署基于Vera Rubin的实例 [22] - 思科、戴尔、HPE、联想和超微等公司预计将提供基于Rubin产品的各类服务器 [25] - Anthropic、Meta、Mistral AI、OpenAI、xAI等AI实验室期待利用Rubin平台以更低的延迟和成本训练更强大模型,并服务长上下文、多模态系统 [26] 产品形态与系统设计 - Rubin平台提供两种主要形态:NVIDIA Vera Rubin NVL72机架级解决方案和NVIDIA HGX Rubin NVL8系统 [4] - Vera Rubin NVL72是一个统一的系统,结合了72个Rubin GPU、36个Vera CPU、NVLink 6、ConnectX-9 SuperNIC和BlueField-4 DPU [15] - HGX Rubin NVL8是一个服务器板,通过NVLink连接八个Rubin GPU,支持基于x86的生成式AI平台,加速AI和高性能计算工作负载的训练、推理和科学计算 [16] - NVIDIA DGX SuperPOD可作为大规模部署Rubin系统的参考架构,集成DGX Vera Rubin NVL72或DGX Rubin NVL8系统以及BlueField-4 DPU、ConnectX-9 SuperNIC等组件 [17] 关键组件与新增功能 - NVIDIA Vera CPU专为智能体推理设计,采用88个NVIDIA定制Olympus核心,是大型AI工厂能效最高的CPU [20] - Rubin平台首次在机架级平台提供NVIDIA机密计算,保护全球最大的专有模型及训练和推理工作负载 [20] - 第二代RAS Engine具备实时健康检查、容错和主动维护功能,其模块化无缆托盘设计使组装和维护速度比Blackwell快18倍 [20] - NVIDIA推出全新的AI原生存储基础设施“推理上下文内存存储平台”,由BlueField-4驱动,旨在实现千兆级别的推理上下文扩展 [12] - BlueField-4还引入了高级安全可信资源架构,为AI基础设施构建者提供单一可信控制点,以安全配置、隔离和操作大规模AI环境 [13] 生产与上市时间 - NVIDIA Rubin已进入全面生产阶段,基于Rubin的产品将于2026年下半年通过合作伙伴上市 [22] - CoreWeave将于2026年下半年开始将基于NVIDIA Rubin的系统集成到其AI云平台中 [24]
NVIDIA (NasdaqGS:NVDA) 2026 Earnings Call Presentation
2026-01-06 05:00
业绩总结 - Hugging Face的月下载量在2023年达到了160百万次[9] - NVIDIA的Rubin GPU的推理性能达到3.6 EFLOPS,训练性能为2.5 EFLOPS[134] - NVIDIA的AI计算需求激增,预计每年令令牌数量增长5倍[113] 用户数据 - 80%的初创公司正在基于开放模型进行构建[10] - 在开放模型中,Owen2-VL-7B在文本识别、文本引用和文本定位的准确率分别为72.1%、47.9%和17.5%[20] 新产品和新技术研发 - 预计到2025年,生成和处理数据的能力将显著提升,推动市场趋势[10] - 公司在2025年将推出全栈自动驾驶平台,搭载在梅赛德斯-奔驰CLA车型上[68] - 预计将发布的语言模型包括Kimi K2和DeepSeek V3.2等[8] - 新推出的六款芯片标志着技术的重大进步[144][147] 市场扩张和并购 - NVIDIA在开放模型生态系统中处于领先地位,推动了多模型和多云的应用[14] - 新平台支持每秒处理5倍更多的tokens,且能实现5倍的能效提升[142] 负面信息 - 在开放模型中,Cosmos-Reason1-78在IntPhys、MVPBench和CausalVQA的准确率分别为59.88%、41.31%和48.17%[18] 其他新策略和有价值的信息 - NVIDIA的Vera CPU具有1.8 TB/s的NVLink-C2C带宽和1.5 TB的系统内存,支持176线程[120] - NVIDIA的HBM4带宽达到1.6 PB/s,较之前提升了2.8倍[134] - NVIDIA的Spectrum-X以102.4 Tb/s的规模扩展交换基础设施,支持128个800 Gb/s端口[136] - NVIDIA的BlueField-4 DPU提供800G Gb/s的网络处理能力,具有64核Grace CPU[127] - NVIDIA的ConnectX-9支持800 Gb/s以太网,具备23亿个晶体管[125] - NVIDIA的NVFP4训练性能为35 PFLOPS,较之前提升了3.5倍[122] - NVIDIA的Vera Rubin GPU拥有3360亿个晶体管,较之前提升了1.6倍[122] - 训练时间减少至原来的四分之一,所需GPU数量减少[148] - 工厂的token产出能力提高至原来的10倍[150] - Token成本降低至原来的十分之一[151] - 预计一个月内可处理100万亿tokens[149] - 提供一个适用于所有AI的统一平台,包括Vera Rubin和Open Models[152]
Counterpoint:需求强劲 台积电(TSM.US)3nm制程成为其史上最快达成全面利用的技术节点
智通财经网· 2025-05-15 20:39
台积电市场地位与技术优势 - 全球晶圆代工市场龙头企业台积电在2022年末库存调整后进一步巩固行业主导地位 [1] - 3nm制程在量产后第五个季度实现产能充分利用 创下先进制程初期市场需求新纪录 [1] - 3nm制程需求主要来自Apple A17 Pro/A18 Pro芯片 x86 PC处理器及其他应用处理器芯片 [1] 先进制程需求驱动因素 - NVIDIA Rubin GPU Google TPU v7 AWS Trainium 3等专用AI芯片推动先进制程高产能延续 [1] - 5/4nm制程在2023年年中恢复增长 主要受NVIDIA H100 B100 B200及GB200等AI加速芯片需求激增带动 [2] - AI算力芯片需求加速AI数据中心建设 显著提升5/4nm制程整体产能 [2] 2nm制程发展前景 - 2nm制程预计在量产后第四个季度达成产能满载 刷新商业化纪录 [5] - 需求来自智能手机与AI应用双重驱动 台积电预计2nm流片数量将超越3nm和5/4nm同期水平 [5] - 潜在客户包括Apple Qualcomm MediaTek Intel AMD等关键厂商 [5] 全球化产能布局 - 台积电向亚利桑那州工厂投资1650亿美元 涵盖4nm 3nm 2nm及更先进制程 [11] - 美国工厂最终可能占据台积电2nm及以下制程产能的30% [11] - 双重布局战略增强地缘政治韧性 同时满足AI和高性能计算领域客户需求 [11]
TSMC 先进制程产能利用率持续保持强劲
Counterpoint Research· 2025-05-15 17:50
台积电市场地位与技术优势 - 台积电在2022年末库存调整后进一步巩固全球晶圆代工市场龙头地位,先进制程产能利用率保持高位[1] - 3nm制程在量产后第五个季度实现产能充分利用,创下先进制程初期市场需求新纪录,主要受Apple A17 Pro/A18 Pro芯片、x86 PC处理器及AP SoC需求驱动[1] - NVIDIA Rubin GPU、Google TPU v7、AWS Trainium 3等专用AI芯片需求推动AI与HPC应用增长,预计先进制程高产能趋势将持续[1] 不同制程产能动态 - 7/6nm制程因智能手机需求在2020年实现产能充分利用,但后续增长放缓[2] - 5/4nm制程在2023年年中恢复增长,受NVIDIA H100、B100、B200及GB200等AI加速芯片需求激增带动,产能显著提升[2] - 3nm制程成为台积电史上最快达成全面利用的技术节点,5/4nm制程在2022年Q3至2023年Q1库存调整后快速回升[4] 2nm制程发展前景 - 2nm制程预计在量产后第四个季度达成产能满载,刷新商业化纪录,受智能手机与AI应用双重需求驱动[7] - 台积电战略目标为2nm技术流片数量在头两年超越3nm和5/4nm同期水平,潜在客户包括Qualcomm、MediaTek、Intel、AMD等[7] - 台积电美国亚利桑那州工厂投资1650亿美元,未来可能承接2nm及以下制程产能的30%,增强地缘政治韧性并满足AI/HPC领域需求[9] 产能布局与战略 - 台积电美国工厂将涵盖4nm、3nm、2nm及更先进制程,核心研发仍集中在台湾[9] - 双重布局战略确保公司2030年后持续保持最先进制程高利用率,同时平衡地缘风险与客户需求[9]