Vera Rubin NVL72
搜索文档
半导体:英伟达业绩影响 -lackwell 架构强劲扩张,进入 “Rubin周期”- Semiconductors Nvidia result implications - Blackwell expanding strongly entering the Rubin Cycle
2026-03-02 01:23
**行业与公司** * **行业**: 人工智能 (AI) 基础设施,包括GPU、先进封装、电源、散热、网络及系统集成 * **核心公司**: * **Nvidia**: AI基础设施核心,其Blackwell和即将到来的Rubin产品周期是讨论焦点 * **上游供应链**: TSMC (台积电) [1][2][7]、KYEC (京元电子) [7]、WinWay (颖崴科技) [7]、CHPT (辛耘) [7] * **下游/系统集成**: Hon Hai (鸿海精密,即富士康) [1][7] * **电源解决方案**: Delta (台达电) [1][5][7] * **散热解决方案**: AVC (奇鋐) [6] * **电源管理芯片代工**: Vanguard (联电,UMC) [5] **Nvidia业绩与产品周期核心观点** * **强劲业绩与展望**: Nvidia 1月季度业绩非常强劲,数据中心收入创新高,Blackwell已开始向超大规模和主权客户出货[2] 公司4月季度指引远超市场预期[2] * **需求结构性增长**: 管理层强调AI基础设施需求是结构性的,而非周期性,预示着跨计算、网络和先进系统架构的持久、多年增长轨迹[2] * **Blackwell持续扩张**: 2026年大部分出货仍将是GB系统,预计超过6万套NVL72系统[1] * **Rubin周期启动**: Nvidia重申Rubin芯片已进入大规模量产,系统级机柜将在2026年下半年开始大量增加[1] Rubin平台将采用TSMC的六芯片架构,包括3nm Rubin GPU、Vera CPU等[2] * **Rubin技术规格**: 3nm Rubin GPU将首次采用5.5倍光罩尺寸的CoWoS封装,集成容量288GB、带宽22 TB/s的HBM4内存[2] * **产量预测**: 预计2026年Nvidia GPU (Blackwell + Rubin) 总产量将达到700万颗[2] **技术演进与产业链机会** * **800V电源架构转型**: Rubin架构单个GPU热设计功耗 (TDP) 可能向2.3kW发展[5] 为应对更高计算密度和功耗,Rubin Ultra (预计2027年) 将更明确地推动800V架构,并引入“电源边车” (Power Sidecar) 机柜[5] 台达电被视为电源解决方案的最大受益者[5] * **液冷散热价值提升**: Vera Rubin NVL72/144标志着向无风扇结构的转型[6] 采用覆盖GPU及其他组件的分布式冷却系统,显著扩大了冷板使用和快速接头需求,从而大幅提升了单托盘的总价值含量[6] AVC是Nvidia一级冷板参考设计合作伙伴,预计将在VR平台保持重要份额[6] * **网络成为关键增长向量**: 随着NVLink和AI以太网结构在系统总价值中占比越来越大,网络预计将保持关键增长动力[2] * **CPO (共封装光学) 机会**: 规模化的CPO机会更多出现在2027年末/2028年的Rubin Ultra阶段[2] 预计2026/2027年CPO的Switch IC出货量分别为4万和100万颗[2] TSMC被认为是Rubin系列和CPO解决方案最关键的合作方[2] **投资偏好与受益公司** * **偏好上游公司**: 基于更好的平均售价 (ASP) 和规格升级,继续偏好Nvidia供应链上游公司[1] * **具体受益公司**: * **上游 (Rubin周期)**: TSMC、KYEC、WinWay、CHPT [7] * **下游**: Delta (台达电) 和 Hon Hai (鸿海) [1][7] * **电源管理芯片代工**: Vanguard (联电,UMC) 将从PMIC代工业务中受益[5] * **业绩驱动**: 预计台达电的电源解决方案将看到显著的ASP提升,驱动潜在盈利上行[7]
不止业绩爆表!高盛点名英伟达三大催化剂,直言“未来数月跑赢路径已清晰”
华尔街见闻· 2026-02-26 14:21
业绩与财务指引 - 第四季度营收为681亿美元,高于高盛预期的673亿美元,并显著超出华尔街共识的662亿美元 [2] - 数据中心业务是核心引擎,单季营收高达623亿美元 [2] - 毛利率为75.2%,营业利润率为67.7%,调整后每股收益为1.76美元,全面超越市场预期 [2] - 公司预计第一季度营收中值将达到780亿美元,远超华尔街预期的721亿美元 [2] - 剔除约19亿美元股权激励费用影响后,第一季度同口径每股收益指引为1.79美元,明显高于市场预期的1.67美元 [2] 未来增长催化剂 - 超大规模云厂商2026年资本开支预测仍有上行空间,且2027年资本开支增长的早期迹象已开始显现 [3] - AI初创企业(如OpenAI、Anthropic)至2027年的采购计划能见度将随融资完成而显著提升 [3] - 基于新一代Blackwell架构训练的AI模型将推向市场,这有助于公司重新彰显其技术领先优势 [3] 战略合作与生态建设 - 公司正在与OpenAI就投资与合作进行积极谈判,预计近期完成签约 [3][4] - 已完成对Anthropic的100亿美元投资,协议包括Anthropic将基于Blackwell和Rubin架构训练其大语言模型 [3][4] - 宣布与Meta达成广泛合作,将提供多种数据中心产品,并计划在2027年合作部署Vera CPU及Vera Rubin NVL72 [4] 盈利能力与成本控制 - 公司预计在整个2026日历年内,仍能将毛利率维持在75%左右的中段水平 [5] - 毛利率的韧性主要归功于公司在2025年做出的与内存相关的大量提前采购承诺 [5] 行业影响与供应链 - 公司强劲的数据中心指引反映了当前极度坚实的AI支出环境,对博通和AMD等数字半导体标的最为有利,并在一定程度上利好Marvell和ARM [6]
盖茨押注硅光突破:旗下Neurophos首款光子芯片性能达英伟达AI超算十倍
环球网资讯· 2026-01-27 17:02
公司技术突破 - 人工智能芯片初创公司Neurophos在硅光子学领域取得重大突破,其开发的光学处理单元采用最小的集成光晶体管,体积较现有技术缩小约10000倍 [1] - 该技术首次实现单芯片上1000×1000像素规模的光子计算矩阵 [1] - 公司技术将光晶体管微型化到可与CMOS工艺兼容的尺度,使大规模并行光计算成为可能,芯片使用的是现有半导体制造流程 [3] 产品性能参数 - 公司首款光学加速器Tulkas T100在FP4/INT4精度下的AI计算性能可达英伟达最新Vera Rubin NVL72人工智能超级计算机的十倍,而功耗水平相当 [3] - 性能优势源于两项关键技术:一是远超当前GPU主流256×256矩阵尺寸的1000×1000光子瓦片,二是高达56 GHz的运行频率 [3] - 该运行频率显著高于英特尔酷睿i9-14900KF处理器的9.1 GHz和英伟达RTX Pro 6000 GPU的2.6 GHz加速频率 [3] - Tulkas T100单芯片仅包含一个面积约为25平方毫米的“光学张量核心”,远少于英伟达Vera Rubin芯片所集成的576个数字张量核心,但通过更高矩阵维度与时钟频率实现了更高的有效吞吐量 [3] 发展现状与规划 - 该技术仍处于工程验证阶段,量产预计不早于2028年 [4] - 未来量产需克服包括片上SRAM容量、矢量处理单元扩展以及光电协同设计在内的多项挑战 [4] - 公司未来有望与英特尔、台积电等主流晶圆厂合作实现量产 [3] 公司背景 - Neurophos是一家由比尔·盖茨旗下盖茨前沿基金投资支持的人工智能芯片初创公司 [1]
Nebius Group (NBIS) Falls Below $100 on Trade Worries
Yahoo Finance· 2026-01-21 15:39
市场表现与宏观环境影响 - 公司股价在周二大幅下跌8.68%,收于每股99.29美元,跌破100美元关口 [1] - 股价下跌与整体市场悲观情绪一致,主要受前总统特朗普计划对八个反对其收购格陵兰计划的国家加征10%关税所引发的地缘政治紧张局势影响 [1][2] - 欧盟表示将进行报复,征收1080亿美元的关税,这一不确定性导致全球市场动荡,投资者抛售头寸 [2][3] - 科技股普遍遭抛售,以科技股为主的纳斯达克指数下跌2.39%,公司的下跌与此趋势一致 [3] 公司业务与战略发展 - 公司宣布将在今年下半年通过Nebius AI Cloud和Nebius Token Factory部署英伟达Rubin平台,以支持客户的下一代推理和智能体AI能力 [4] - 作为英伟达云合作伙伴,公司将成为首批在美国和欧洲数据中心的全栈基础设施上提供该平台的AI云提供商之一 [4] - 该平台(Vera Rubin NVL72)旨在满足复杂AI工作负载的需求,包括智能体、高级推理和大规模专家混合模型,其设计目标是以最低的单令牌成本解决多步骤问题 [5]
行业点评报告:VeraRubinNVL72推出,六芯协同架构重塑AI算力基建
开源证券· 2026-01-11 22:42
行业投资评级 - 投资评级:看好(维持)[1] 核心观点 - 英伟达(NVIDIA)在CES 2026上推出Rubin AI平台及Rubin NVL72机柜级解决方案,通过六芯协同设计实现性能飞跃与成本降低,重塑AI算力基础设施[4][5] - Rubin NVL72的创新趋势呈现五大核心方向:极致带宽、易维护性、高效扩展性、深度协同和安全性,将驱动产业链相关环节升级[6] 技术创新与架构细节 - **六芯协同设计**:平台通过对Vera CPU、Rubin GPU、NVLink6交换机、ConnectX9 SuperNIC、BlueField4 DPU和Spectrum 6以太网交换机进行极致协同设计,大幅缩短训练时间并降低推理token成本[4] - **系统配置**:Rubin NVL72整合18个计算托盘与9个NVLink 6交换托盘,每个计算托盘集成2个Vera CPU与4块Rubin GPU的Superchip,系统总计包含72个GPU与36个CPU[5] - **极致带宽**:计算层通过NVLink-C2C实现CPU-GPU互联带宽达1.8TB/s,HBM4显存为单GPU提供288GB容量与22TB/s带宽,第六代NVLink技术使单GPU带宽和机柜总带宽均实现翻倍[5][6] - **无缆化与易维护**:采用Cable-Free无缆托盘与高密度Midplane背板设计,支持热插拔,可在系统运行时直接更换故障组件,大幅提升装配及维护效率[6] - **高效扩展性**:网络层以NVLink 6交换机达成GPU间3.6TB/s全互联(Scale-up),结合采用CPO(共封装光学)技术的Spectrum-X交换机(512×200Gbps)实现横向扩展(Scale-out),显著提升能效[5][6] - **深度互联与存储**:CPU与GPU通过NVLink-C2C实现超高速互联,消除PCIe总线带宽瓶颈,BlueField-4 DPU集成150TB NAND上下文存储池,为每GPU分配16TB存储[5][6] - **辅助系统**:采用全覆盖液冷系统,并集成机架级机密计算与RAS(可靠性、可用性、可服务性)引擎[5] 产业链受益标的 - **整机组装**:工业富联[7] - **连接器**:立讯精密、汇聚科技、瑞可达等[7] - **PCB**:胜宏科技、沪电股份、生益科技、景旺电子等[7] - **散热**:英维克、领益智造、蓝思科技、思泉新材、中石科技[7] - **电源**:欧陆通、奥海科技[7]
老黄All in物理AI!最新GPU性能5倍提升,还砸掉了智驾门槛
具身智能之心· 2026-01-07 11:33
文章核心观点 - 英伟达在CES 2026上发布了一系列面向物理AI和Agentic AI的新产品与平台,标志着其战略重心从游戏显卡全面转向AI,并将技术护城河从芯片层拓展至全栈平台层(模型+数据+工具)[1][2][6][9] 下一代数据中心架构:Vera Rubin - 正式推出下一代AI数据中心机柜架构Vera Rubin NVL72,其六大核心组件包括Vera CPU、Rubin GPU、NVLink 6 switch、ConnectX-9 SuperNIC、BlueField-4 DPU、Spectrum-6 Ethernet switch[14][15] - Rubin GPU在NVFP4数据格式下,推理性能达50 PFLOPS,是Blackwell GB200的5倍;训练性能达35 PFLOPS,是Blackwell的3.5倍[4][17] - 每颗Rubin GPU封装8组HBM4内存,提供288GB容量和22 TB/s带宽[18] - 引入NVLink 6用于规模内扩展网络,单GPU互连带宽达3.6 TB/s(双向),每个机架配备9颗交换芯片,总规模内带宽达260 TB/s[20][21] - Vera CPU集成88个定制Olympus Arm核心,最多可同时运行176个线程,其与GPU的NVLink C2C互连带宽达1.8 TB/s,可寻址最多1.5 TB的LPDDR5X内存[22] - 推出基于Spectrum-6芯片的共封装光学以太网交换机,用于机架扩展,其中SN688提供409.6 Tb/s总带宽,SN6810提供102.4 Tb/s总带宽[24][25][26][27] - 推出BlueField-4 DPU,构建推理上下文内存存储平台,旨在高效共享与复用键值缓存数据,提升系统响应与吞吐[32][34] - 每个Vera Rubin NVL72机架可提供3.6 exaFLOPS的NVFP4推理性能、2.5 exaFLOPS的NVFP4训练性能、54 TB的LPDDR5X内存以及20.7 TB带宽达1.6 PB/s的HBM4内存[36][37] - 与Blackwell相比,Vera Rubin训练MoE模型所需GPU数量仅为四分之一,在MoE推理场景下每token成本最高可降低10倍[36] - 用于构建该机架的六类芯片已全部从晶圆厂交付,预计2026年下半年启动规模化量产[38] 自动驾驶开源模型与生态 - 发布全新开源模型系列Alpamayo,面向安全推理的自动驾驶,其中Alpamayo 1是全球首款开源、大规模的自动驾驶视觉-语言-行动推理模型,参数为100亿[39][41] - 模型接收车辆运动历史、多摄像头实时视频和用户指令,输出驾驶决策、因果推理结果和行驶轨迹[42] - 配套发布开源仿真框架AlpacaSim,以及一个包含1700小时驾驶数据的开源数据集,数据涵盖全球广泛地理区域与复杂边缘场景[44][45] - Alpamayo将率先搭载于2025年第二季度欧洲上市的梅赛德斯-奔驰CLA车型,后续通过OTA升级推送更多自动驾驶功能[45] - 展示了基于自身技术构建的全球L4级自动驾驶与Robotaxi生态系统全景,覆盖软件开发商、整车厂/出行平台、硬件供应商全产业链[47] AI智能体与多模态模型 - NVIDIA Nemotron模型家族推出针对语音、RAG以及安全三大场景的专项模型[49] - Nemotron Speech包含新的自动语音识别模型,支持实时低延迟场景如实时字幕生成,速度比同类模型快10倍,已被博世采用[51][52] - Nemotron RAG搭载新的视觉语言模型,能精准处理多语言、多模态数据以提升文档搜索效率[53] - Nemotron Safety系列模型专注于增强AI应用安全性与可信度,包括内容安全模型和检测敏感数据的PII模型[53] 物理AI与机器人平台 - 为机器人推出的“大脑”Cosmos平台升级,全新发布Cosmos Reason 2(视觉-语言推理模型)、Cosmos Transfer 2.5与Cosmos Predict 2.5(合成视频生成模型)[56][60] - 发布Isaac GR00T N1.6,一款专为类人机器人打造的开源视觉-语言-行动推理模型,支持全身控制并集成Cosmos Reason模型[61] - 发布NVIDIA AI Blueprint for Video Search and Summarization,提供参考工作流以构建能分析大量录播及直播视频的视觉AI智能体[61] - Cosmos平台已被Figure、Agility Robotics、通用汽车等公司采用,其模型正被Salesforce、Uber等企业用于开发AI智能体[54][58] 医疗健康与生命科学AI - NVIDIA Clara是专门针对医疗健康与生命科学领域的AI技术工具,旨在降低行业成本、加速治疗方案落地[62][63] - 该系列包含多款专项模型:La-Proteina(设计大型蛋白质)、ReaSyn v2(药物生产考虑)、KERMT(预测药物人体反应)、RNAPro(预测RNA 3D结构)[64][69] - 将为研究者提供包含45.5万个合成蛋白质结构的数据集[66] 开源与生态建设 - 宣布持续向社区开源训练框架以及多模态数据集,数据集包括10万亿语言训练token、50万条机器人轨迹数据、45.5万个蛋白质结构、100TB车辆传感器数据[5] - 演讲中提及国产开源模型DeepSeek、Kimi K2、Qwen,体现了对全球开源生态的关注[11][12]
跻身英伟达Rubin首批云服务商:Nebius(NBIS.US)将于2026下半年上线Vera Rubin NVL72算力集群
智通财经· 2026-01-06 21:41
公司战略与产品部署 - Nebius公司计划从2026年下半年开始,在美国和欧洲提供英伟达的Vera Rubin NVL72图形处理器(GPU) [1] - 公司将通过其Nebius AI云和Nebius Token Factory(一个面向企业的推理及训练后平台)部署英伟达Rubin平台,并成为首批提供该计算平台的AI云供应商之一 [1] - 公司将把Vera Rubin NVL72集成到其位于美国和欧洲数据中心的全栈基础设施中,旨在使客户能够构建具有区域可用性和可控性的下一代AI应用程序 [1] - 公司创始人兼首席执行官表示,此举旨在为AI创新者和企业提供基础设施,帮助他们更快、更高效地开发代理式和推理式AI系统 [1] - Rubin加速计算平台将与公司现有的英伟达GB200 NVL72和英伟达Grace Blackwell Ultra NVL72产能形成互补,以扩大客户对平台的选择范围 [2] 行业技术进展与产品规格 - 英伟达首席执行官指出,作为Grace Blackwell的继任者,下一代计算平台Vera Rubin目前已进入全面量产阶段 [2] - 英伟达高管将Vera Rubin平台描述为“六颗芯片构成的一台AI超级计算机”,其核心组件包括Vera CPU、Rubin GPU、第六代NVLink交换芯片、ConnectX-9网卡、BlueField4 DPU以及Spectrum-X102.4T CPO [2] - 该平台面向云端与大型数据中心的下一代AI工作负载 [2] - Rubin GPU芯片搭载第三代Transformer引擎,其NVFP4推理算力为50 PFLOPS,是英伟达上一代Blackwell GPU的5倍 [3] - 在整体架构层面,Vera Rubin平台在相同训练时间内可完成超大规模“专家混合”(Mixture of Experts,MOE)模型的训练,却只需原来四分之一数量的GPU,且每个token的训练成本降至原来的七分之一 [3] - 英伟达强调,Vera Rubin将支持第三代机密计算技术,并将成为业界首个机架级可信计算平台,面向对安全隔离、数据隐私与多租户环境有高要求的AI场景 [3]
老黄All in物理AI!最新GPU性能5倍提升,还砸掉了智驾门槛
量子位· 2026-01-06 09:01
公司战略与核心主题 - 公司在CES 2026上明确展示全力投入AI领域的战略,五年来首次未发布游戏显卡[2] - 核心主题直指物理AI,旨在将技术护城河从芯片层拓展至全栈平台层(模型+数据+工具),以拉动更多GPU与基础设施投入并增强用户与生态锁定[7][10] 下一代数据中心架构:Vera Rubin - 正式推出下一代AI数据中心机柜架构Vera Rubin NVL72,预计2026年下半年启动规模化量产[14][38] - 架构由六大核心组件构成:Vera CPU、Rubin GPU、NVLink 6 switch、ConnectX-9 SuperNIC、BlueField-4 DPU、Spectrum-6 Ethernet switch[15] - 在NVFP4数据类型下,Rubin GPU推理性能达50 PFLOPS,是Blackwell GB200的5倍;训练性能达35 PFLOPS,是Blackwell的3.5倍[4][17] - 每颗Rubin GPU封装8组HBM4内存,提供288GB容量和22 TB/s带宽[18] - 引入NVLink 6,将单GPU互连带宽提升至3.6 TB/s(双向),每个机架配备9颗交换芯片,总规模内带宽达260 TB/s[20][21] - Vera CPU集成88个定制Olympus Arm核心,最多可同时运行176个线程,与GPU连接的NVLink C2C互连带宽达1.8 TB/s,可寻址最多1.5 TB的LPDDR5X内存[22] - 推出采用共封装光学(CPO)的Spectrum-X以太网交换机用于扩展,其中SN688提供409.6 Tb/s总带宽,SN6810提供102.4 Tb/s总带宽[24][25][26][27] - 推出BlueField-4 DPU构建新的“推理上下文内存存储平台”,旨在高效共享与复用键值缓存数据,提升系统响应和吞吐能力[32][34] - 每个Vera Rubin NVL72机架整体可提供3.6 exaFLOPS的NVFP4推理性能、2.5 exaFLOPS的NVFP4训练性能、54 TB的LPDDR5X内存以及20.7 TB带宽达1.6 PB/s的HBM4内存[36][37] - 与Blackwell相比,训练MoE模型所需GPU数量仅为四分之一,在MoE推理场景下每token成本最高可降低10倍[36] 自动驾驶领域发布 - 推出面向安全推理自动驾驶的全新开源模型系列Alpamayo[39] - 发布全球首款开源、大规模的自动驾驶视觉-语言-行动推理模型Alpamayo 1,参数100亿,能理解环境并解释决策行为[41][42] - 配套推出开源仿真框架AlpacaSim,并发布包含1700小时驾驶数据的开源数据集,涵盖广泛地理区域与复杂边缘场景[44][45] - Alpamayo将率先搭载于2025年第二季度欧洲上市的梅赛德斯-奔驰CLA车型,后续通过OTA升级推送高级自动驾驶功能[45] - 展示了基于自身技术构建的全球L4级自动驾驶与Robotaxi生态系统全景,覆盖全产业链[47] AI模型与平台更新 - 推出面向Agentic AI的NVIDIA Nemotron模型家族,并持续向社区开源训练框架及多模态数据集[6] - 开源数据集包括10万亿语言训练token、50万条机器人轨迹数据、45.5万个蛋白质结构、100TB车辆传感器数据[6] - Nemotron进一步推出针对语音、RAG以及安全三大场景的专项模型[49] - Nemotron Speech包含新的自动语音识别模型,在实时低延迟场景中速度比同类模型快10倍,已被博世采用[51][52] - Nemotron RAG搭载新的视觉语言模型以提升文档搜索效率,Nemotron Safety系列模型专注于增强AI应用安全性与可信度[53] - 公司在演讲中提及国产开源模型DeepSeek、Kimi K2、Qwen[11][12] 物理AI与机器人 - 为机器人推出的“大脑”Cosmos平台升级,全新发布Cosmos Reason 2视觉-语言推理模型、Cosmos Transfer 2.5与Cosmos Predict 2.5合成视频生成模型[56][59] - 发布专为类人机器人打造的开源视觉-语言-行动推理模型Isaac GR00T N1.6,支持全身控制并集成Cosmos Reason模型[60] - 推出NVIDIA AI Blueprint for Video Search and Summarization参考工作流,用于构建分析视频的视觉AI智能体[60] - Cosmos平台已被Figure、Agility Robotics、通用汽车等公司采用,其模型正被Salesforce、Uber等企业用于开发AI智能体[54][58] 生物医学领域 - 推出专门针对医疗健康与生命科学领域的AI技术工具NVIDIA Clara,旨在降低行业成本、加速治疗方案落地[61][62] - 该系列包含多款专项模型:La-Proteina能设计原子级精度的大型蛋白质;ReaSyn v2在药物发现阶段考虑生产问题;KERMT预测潜在药物人体反应;RNAPro预测RNA分子3D结构[68] - 将为研究者提供包含45.5万个合成蛋白质结构的数据集[65]