Workflow
Vera Rubin NVL72
icon
搜索文档
Nebius Group (NBIS) Falls Below $100 on Trade Worries
Yahoo Finance· 2026-01-21 15:39
市场表现与宏观环境影响 - 公司股价在周二大幅下跌8.68%,收于每股99.29美元,跌破100美元关口 [1] - 股价下跌与整体市场悲观情绪一致,主要受前总统特朗普计划对八个反对其收购格陵兰计划的国家加征10%关税所引发的地缘政治紧张局势影响 [1][2] - 欧盟表示将进行报复,征收1080亿美元的关税,这一不确定性导致全球市场动荡,投资者抛售头寸 [2][3] - 科技股普遍遭抛售,以科技股为主的纳斯达克指数下跌2.39%,公司的下跌与此趋势一致 [3] 公司业务与战略发展 - 公司宣布将在今年下半年通过Nebius AI Cloud和Nebius Token Factory部署英伟达Rubin平台,以支持客户的下一代推理和智能体AI能力 [4] - 作为英伟达云合作伙伴,公司将成为首批在美国和欧洲数据中心的全栈基础设施上提供该平台的AI云提供商之一 [4] - 该平台(Vera Rubin NVL72)旨在满足复杂AI工作负载的需求,包括智能体、高级推理和大规模专家混合模型,其设计目标是以最低的单令牌成本解决多步骤问题 [5]
行业点评报告:VeraRubinNVL72推出,六芯协同架构重塑AI算力基建
开源证券· 2026-01-11 22:42
行业投资评级 - 投资评级:看好(维持)[1] 核心观点 - 英伟达(NVIDIA)在CES 2026上推出Rubin AI平台及Rubin NVL72机柜级解决方案,通过六芯协同设计实现性能飞跃与成本降低,重塑AI算力基础设施[4][5] - Rubin NVL72的创新趋势呈现五大核心方向:极致带宽、易维护性、高效扩展性、深度协同和安全性,将驱动产业链相关环节升级[6] 技术创新与架构细节 - **六芯协同设计**:平台通过对Vera CPU、Rubin GPU、NVLink6交换机、ConnectX9 SuperNIC、BlueField4 DPU和Spectrum 6以太网交换机进行极致协同设计,大幅缩短训练时间并降低推理token成本[4] - **系统配置**:Rubin NVL72整合18个计算托盘与9个NVLink 6交换托盘,每个计算托盘集成2个Vera CPU与4块Rubin GPU的Superchip,系统总计包含72个GPU与36个CPU[5] - **极致带宽**:计算层通过NVLink-C2C实现CPU-GPU互联带宽达1.8TB/s,HBM4显存为单GPU提供288GB容量与22TB/s带宽,第六代NVLink技术使单GPU带宽和机柜总带宽均实现翻倍[5][6] - **无缆化与易维护**:采用Cable-Free无缆托盘与高密度Midplane背板设计,支持热插拔,可在系统运行时直接更换故障组件,大幅提升装配及维护效率[6] - **高效扩展性**:网络层以NVLink 6交换机达成GPU间3.6TB/s全互联(Scale-up),结合采用CPO(共封装光学)技术的Spectrum-X交换机(512×200Gbps)实现横向扩展(Scale-out),显著提升能效[5][6] - **深度互联与存储**:CPU与GPU通过NVLink-C2C实现超高速互联,消除PCIe总线带宽瓶颈,BlueField-4 DPU集成150TB NAND上下文存储池,为每GPU分配16TB存储[5][6] - **辅助系统**:采用全覆盖液冷系统,并集成机架级机密计算与RAS(可靠性、可用性、可服务性)引擎[5] 产业链受益标的 - **整机组装**:工业富联[7] - **连接器**:立讯精密、汇聚科技、瑞可达等[7] - **PCB**:胜宏科技、沪电股份、生益科技、景旺电子等[7] - **散热**:英维克、领益智造、蓝思科技、思泉新材、中石科技[7] - **电源**:欧陆通、奥海科技[7]
老黄All in物理AI!最新GPU性能5倍提升,还砸掉了智驾门槛
具身智能之心· 2026-01-07 11:33
文章核心观点 - 英伟达在CES 2026上发布了一系列面向物理AI和Agentic AI的新产品与平台,标志着其战略重心从游戏显卡全面转向AI,并将技术护城河从芯片层拓展至全栈平台层(模型+数据+工具)[1][2][6][9] 下一代数据中心架构:Vera Rubin - 正式推出下一代AI数据中心机柜架构Vera Rubin NVL72,其六大核心组件包括Vera CPU、Rubin GPU、NVLink 6 switch、ConnectX-9 SuperNIC、BlueField-4 DPU、Spectrum-6 Ethernet switch[14][15] - Rubin GPU在NVFP4数据格式下,推理性能达50 PFLOPS,是Blackwell GB200的5倍;训练性能达35 PFLOPS,是Blackwell的3.5倍[4][17] - 每颗Rubin GPU封装8组HBM4内存,提供288GB容量和22 TB/s带宽[18] - 引入NVLink 6用于规模内扩展网络,单GPU互连带宽达3.6 TB/s(双向),每个机架配备9颗交换芯片,总规模内带宽达260 TB/s[20][21] - Vera CPU集成88个定制Olympus Arm核心,最多可同时运行176个线程,其与GPU的NVLink C2C互连带宽达1.8 TB/s,可寻址最多1.5 TB的LPDDR5X内存[22] - 推出基于Spectrum-6芯片的共封装光学以太网交换机,用于机架扩展,其中SN688提供409.6 Tb/s总带宽,SN6810提供102.4 Tb/s总带宽[24][25][26][27] - 推出BlueField-4 DPU,构建推理上下文内存存储平台,旨在高效共享与复用键值缓存数据,提升系统响应与吞吐[32][34] - 每个Vera Rubin NVL72机架可提供3.6 exaFLOPS的NVFP4推理性能、2.5 exaFLOPS的NVFP4训练性能、54 TB的LPDDR5X内存以及20.7 TB带宽达1.6 PB/s的HBM4内存[36][37] - 与Blackwell相比,Vera Rubin训练MoE模型所需GPU数量仅为四分之一,在MoE推理场景下每token成本最高可降低10倍[36] - 用于构建该机架的六类芯片已全部从晶圆厂交付,预计2026年下半年启动规模化量产[38] 自动驾驶开源模型与生态 - 发布全新开源模型系列Alpamayo,面向安全推理的自动驾驶,其中Alpamayo 1是全球首款开源、大规模的自动驾驶视觉-语言-行动推理模型,参数为100亿[39][41] - 模型接收车辆运动历史、多摄像头实时视频和用户指令,输出驾驶决策、因果推理结果和行驶轨迹[42] - 配套发布开源仿真框架AlpacaSim,以及一个包含1700小时驾驶数据的开源数据集,数据涵盖全球广泛地理区域与复杂边缘场景[44][45] - Alpamayo将率先搭载于2025年第二季度欧洲上市的梅赛德斯-奔驰CLA车型,后续通过OTA升级推送更多自动驾驶功能[45] - 展示了基于自身技术构建的全球L4级自动驾驶与Robotaxi生态系统全景,覆盖软件开发商、整车厂/出行平台、硬件供应商全产业链[47] AI智能体与多模态模型 - NVIDIA Nemotron模型家族推出针对语音、RAG以及安全三大场景的专项模型[49] - Nemotron Speech包含新的自动语音识别模型,支持实时低延迟场景如实时字幕生成,速度比同类模型快10倍,已被博世采用[51][52] - Nemotron RAG搭载新的视觉语言模型,能精准处理多语言、多模态数据以提升文档搜索效率[53] - Nemotron Safety系列模型专注于增强AI应用安全性与可信度,包括内容安全模型和检测敏感数据的PII模型[53] 物理AI与机器人平台 - 为机器人推出的“大脑”Cosmos平台升级,全新发布Cosmos Reason 2(视觉-语言推理模型)、Cosmos Transfer 2.5与Cosmos Predict 2.5(合成视频生成模型)[56][60] - 发布Isaac GR00T N1.6,一款专为类人机器人打造的开源视觉-语言-行动推理模型,支持全身控制并集成Cosmos Reason模型[61] - 发布NVIDIA AI Blueprint for Video Search and Summarization,提供参考工作流以构建能分析大量录播及直播视频的视觉AI智能体[61] - Cosmos平台已被Figure、Agility Robotics、通用汽车等公司采用,其模型正被Salesforce、Uber等企业用于开发AI智能体[54][58] 医疗健康与生命科学AI - NVIDIA Clara是专门针对医疗健康与生命科学领域的AI技术工具,旨在降低行业成本、加速治疗方案落地[62][63] - 该系列包含多款专项模型:La-Proteina(设计大型蛋白质)、ReaSyn v2(药物生产考虑)、KERMT(预测药物人体反应)、RNAPro(预测RNA 3D结构)[64][69] - 将为研究者提供包含45.5万个合成蛋白质结构的数据集[66] 开源与生态建设 - 宣布持续向社区开源训练框架以及多模态数据集,数据集包括10万亿语言训练token、50万条机器人轨迹数据、45.5万个蛋白质结构、100TB车辆传感器数据[5] - 演讲中提及国产开源模型DeepSeek、Kimi K2、Qwen,体现了对全球开源生态的关注[11][12]
跻身英伟达Rubin首批云服务商:Nebius(NBIS.US)将于2026下半年上线Vera Rubin NVL72算力集群
智通财经· 2026-01-06 21:41
公司战略与产品部署 - Nebius公司计划从2026年下半年开始,在美国和欧洲提供英伟达的Vera Rubin NVL72图形处理器(GPU) [1] - 公司将通过其Nebius AI云和Nebius Token Factory(一个面向企业的推理及训练后平台)部署英伟达Rubin平台,并成为首批提供该计算平台的AI云供应商之一 [1] - 公司将把Vera Rubin NVL72集成到其位于美国和欧洲数据中心的全栈基础设施中,旨在使客户能够构建具有区域可用性和可控性的下一代AI应用程序 [1] - 公司创始人兼首席执行官表示,此举旨在为AI创新者和企业提供基础设施,帮助他们更快、更高效地开发代理式和推理式AI系统 [1] - Rubin加速计算平台将与公司现有的英伟达GB200 NVL72和英伟达Grace Blackwell Ultra NVL72产能形成互补,以扩大客户对平台的选择范围 [2] 行业技术进展与产品规格 - 英伟达首席执行官指出,作为Grace Blackwell的继任者,下一代计算平台Vera Rubin目前已进入全面量产阶段 [2] - 英伟达高管将Vera Rubin平台描述为“六颗芯片构成的一台AI超级计算机”,其核心组件包括Vera CPU、Rubin GPU、第六代NVLink交换芯片、ConnectX-9网卡、BlueField4 DPU以及Spectrum-X102.4T CPO [2] - 该平台面向云端与大型数据中心的下一代AI工作负载 [2] - Rubin GPU芯片搭载第三代Transformer引擎,其NVFP4推理算力为50 PFLOPS,是英伟达上一代Blackwell GPU的5倍 [3] - 在整体架构层面,Vera Rubin平台在相同训练时间内可完成超大规模“专家混合”(Mixture of Experts,MOE)模型的训练,却只需原来四分之一数量的GPU,且每个token的训练成本降至原来的七分之一 [3] - 英伟达强调,Vera Rubin将支持第三代机密计算技术,并将成为业界首个机架级可信计算平台,面向对安全隔离、数据隐私与多租户环境有高要求的AI场景 [3]
老黄All in物理AI!最新GPU性能5倍提升,还砸掉了智驾门槛
量子位· 2026-01-06 09:01
公司战略与核心主题 - 公司在CES 2026上明确展示全力投入AI领域的战略,五年来首次未发布游戏显卡[2] - 核心主题直指物理AI,旨在将技术护城河从芯片层拓展至全栈平台层(模型+数据+工具),以拉动更多GPU与基础设施投入并增强用户与生态锁定[7][10] 下一代数据中心架构:Vera Rubin - 正式推出下一代AI数据中心机柜架构Vera Rubin NVL72,预计2026年下半年启动规模化量产[14][38] - 架构由六大核心组件构成:Vera CPU、Rubin GPU、NVLink 6 switch、ConnectX-9 SuperNIC、BlueField-4 DPU、Spectrum-6 Ethernet switch[15] - 在NVFP4数据类型下,Rubin GPU推理性能达50 PFLOPS,是Blackwell GB200的5倍;训练性能达35 PFLOPS,是Blackwell的3.5倍[4][17] - 每颗Rubin GPU封装8组HBM4内存,提供288GB容量和22 TB/s带宽[18] - 引入NVLink 6,将单GPU互连带宽提升至3.6 TB/s(双向),每个机架配备9颗交换芯片,总规模内带宽达260 TB/s[20][21] - Vera CPU集成88个定制Olympus Arm核心,最多可同时运行176个线程,与GPU连接的NVLink C2C互连带宽达1.8 TB/s,可寻址最多1.5 TB的LPDDR5X内存[22] - 推出采用共封装光学(CPO)的Spectrum-X以太网交换机用于扩展,其中SN688提供409.6 Tb/s总带宽,SN6810提供102.4 Tb/s总带宽[24][25][26][27] - 推出BlueField-4 DPU构建新的“推理上下文内存存储平台”,旨在高效共享与复用键值缓存数据,提升系统响应和吞吐能力[32][34] - 每个Vera Rubin NVL72机架整体可提供3.6 exaFLOPS的NVFP4推理性能、2.5 exaFLOPS的NVFP4训练性能、54 TB的LPDDR5X内存以及20.7 TB带宽达1.6 PB/s的HBM4内存[36][37] - 与Blackwell相比,训练MoE模型所需GPU数量仅为四分之一,在MoE推理场景下每token成本最高可降低10倍[36] 自动驾驶领域发布 - 推出面向安全推理自动驾驶的全新开源模型系列Alpamayo[39] - 发布全球首款开源、大规模的自动驾驶视觉-语言-行动推理模型Alpamayo 1,参数100亿,能理解环境并解释决策行为[41][42] - 配套推出开源仿真框架AlpacaSim,并发布包含1700小时驾驶数据的开源数据集,涵盖广泛地理区域与复杂边缘场景[44][45] - Alpamayo将率先搭载于2025年第二季度欧洲上市的梅赛德斯-奔驰CLA车型,后续通过OTA升级推送高级自动驾驶功能[45] - 展示了基于自身技术构建的全球L4级自动驾驶与Robotaxi生态系统全景,覆盖全产业链[47] AI模型与平台更新 - 推出面向Agentic AI的NVIDIA Nemotron模型家族,并持续向社区开源训练框架及多模态数据集[6] - 开源数据集包括10万亿语言训练token、50万条机器人轨迹数据、45.5万个蛋白质结构、100TB车辆传感器数据[6] - Nemotron进一步推出针对语音、RAG以及安全三大场景的专项模型[49] - Nemotron Speech包含新的自动语音识别模型,在实时低延迟场景中速度比同类模型快10倍,已被博世采用[51][52] - Nemotron RAG搭载新的视觉语言模型以提升文档搜索效率,Nemotron Safety系列模型专注于增强AI应用安全性与可信度[53] - 公司在演讲中提及国产开源模型DeepSeek、Kimi K2、Qwen[11][12] 物理AI与机器人 - 为机器人推出的“大脑”Cosmos平台升级,全新发布Cosmos Reason 2视觉-语言推理模型、Cosmos Transfer 2.5与Cosmos Predict 2.5合成视频生成模型[56][59] - 发布专为类人机器人打造的开源视觉-语言-行动推理模型Isaac GR00T N1.6,支持全身控制并集成Cosmos Reason模型[60] - 推出NVIDIA AI Blueprint for Video Search and Summarization参考工作流,用于构建分析视频的视觉AI智能体[60] - Cosmos平台已被Figure、Agility Robotics、通用汽车等公司采用,其模型正被Salesforce、Uber等企业用于开发AI智能体[54][58] 生物医学领域 - 推出专门针对医疗健康与生命科学领域的AI技术工具NVIDIA Clara,旨在降低行业成本、加速治疗方案落地[61][62] - 该系列包含多款专项模型:La-Proteina能设计原子级精度的大型蛋白质;ReaSyn v2在药物发现阶段考虑生产问题;KERMT预测潜在药物人体反应;RNAPro预测RNA分子3D结构[68] - 将为研究者提供包含45.5万个合成蛋白质结构的数据集[65]