NVIDIA Vera Rubin NVL72
搜索文档
联想集团与英伟达联合发布新一代联想混合式AI优势集解决方案
新华财经· 2026-03-17 16:27
公司动态与产品发布 - 联想集团与英伟达在GTC 2026大会上联合发布新一代联想Hybrid AI Advantage(混合式AI优势集)解决方案 [1] - 该解决方案旨在加速AI落地、缩短首token时间(TTFT),并在个人、企业和云环境中带来可量化的商业成果 [1] - 联想集团正式成为NVIDIA Vera Rubin NVL72的全球首发合作伙伴 [1] 技术方案与性能提升 - 新一代混合式AI解决方案覆盖范围从终端扩展到数据中心,再扩展至吉瓦级AI云部署 [1] - 该方案旨在全球范围内赋能实时决策、运营效率提升和智能自动化 [1] - 较上一代相比,Vera Rubin系统吞吐量提升高达10倍 [1] - Vera Rubin系统单token成本下降至前一代的1/10,将极大实现更快部署、更低成本 [1] 行业趋势与公司战略 - 随着agentic AI推动推理工作负载呈指数级增长,成本控制和单token性能将变得至关重要 [1] - 通过将NVIDIA AI Enterprise软件与联想全栈混合AI平台和服务结合,公司能够帮助客户以更高效率、更低单token成本、更快的投产速度来扩展AI应用规模 [1]
Supermicro Reveals DCBBS® with New NVIDIA Vera Rubin NVL72, HGX Rubin NVL8, and Vera CPU Systems, Designed to Accelerate Customer Time-to-Market
Prnewswire· 2026-03-17 04:35
公司新产品发布 - 公司发布了基于NVIDIA Vera Rubin平台的新系统产品组合,包括NVIDIA Vera Rubin NVL72、NVIDIA HGX Rubin NVL8和NVIDIA Vera CPU系统 [1] - 新产品旨在加速客户的产品上市时间,并采用公司的数据中心构建块解决方案(DCBBS)先进液冷技术栈进行设计和构建 [1] - 公司总裁兼CEO表示,公司DCBBS技术栈旨在赋能即将推出的NVIDIA平台系统,为客户提供一条清晰、快速的路径,以大规模部署下一代AI工厂 [2] 产品技术架构与优势 - 公司的DCBBS模块化方法使数据中心运营商能够部署经过验证的、预先设计的机架解决方案,而非为每个项目定制构建基础设施,从而减少上线时间、降低集成风险并降低任何规模AI工厂部署的总拥有成本 [3] - DCBBS专门设计用于满足不断发展的热、电力和网络需求,以支持NVIDIA新平台的快速稳健部署,并包含全套经过验证的液冷基础设施组件 [4] - Vera Rubin NVL72作为单机架级加速器运行,统一了六个协同设计的芯片,可提供高达3.6 Exaflops的推理性能、75TB快速内存和1.6 PB/s的HBM4带宽 [6] - 与NVIDIA Blackwell解决方案相比,NVIDIA Vera Rubin NVL72和HGX Rubin NVL8系统的目标是实现每瓦特吞吐量提升高达10倍,令牌成本降低至十分之一 [5][6] 具体产品规格 - 公司正在设计其NVIDIA Vera Rubin NVL72,并采用新的DCBBS液冷组件,以完全支持机架和集群级别的功率和热设计范围 [5] - 公司的2U HGX Rubin NVL8系统是最灵活的平台,支持NVIDIA Vera和下一代x86 CPU,每个机架可扩展至72个Rubin GPU,并为没有液冷的数据中心提供DCBBS液气(L2A)侧挂CDU选项 [5] - 2U HGX Rubin NVL8系统基于NVIDIA MGX机架架构构建,采用公司的盲插汇流排和歧管,可实现免工具机架集成,允许客户将八个Rubin GPU与最适合其工作负载和软件堆栈的CPU平台配对 [7] - 该设计支持每个机架放置9个HGX Rubin NVL8系统,总计最多72个Rubin GPU,适用于大规模AI训练、推理和加速HPC [8] - 公司的Vera CPU下一代智能体AI系统采用紧凑的2U机箱,配备双NVIDIA Vera CPU,支持最多6个RTX PRO 4500 Blackwell服务器版GPU,提供高计算密度和能效 [9] 存储与网络创新 - 公司即将推出的上下文内存存储平台(CMX)引入了一类新的AI原生存储,架构为智能Pod级上下文内存存储层,可扩展GPU KV缓存容量,并以Vera Rubin NVL72超级Pod集群所需的吞吐量提供长上下文推理数据 [10] - 该平台由NVIDIA BlueField-4处理器、NVIDIA Vera CPU、NVIDIA ConnectX-9 SuperNIC、Spectrum-X以太网、NVIDIA DOCA和NVIDIA Dynamo提供支持,为大规模AI推理管道和RAG工作负载提供所需的高带宽、低延迟结构和智能数据路径卸载 [10] 产品供应与战略 - 公司当前的基于NVIDIA Blackwell的系统组合正在全面生产,并可通过其美国和全球制造能力立即部署,使客户能够立即构建和扩展生产型AI基础设施 [11] - 公司同时投资于当前的Blackwell产品线和下一代系统,以确保客户在此转型的每个阶段都拥有合适的平台 [11] - 公司将在GTC San Jose 2026上展示其Vera Rubin平台系统的早期预览以及当前生产的Blackwell产品组合 [12]
Wiwynn Showcases NVIDIA Vera Rubin NVL72 AI Factory Infrastructure at NVIDIA GTC 2026
Prnewswire· 2026-03-17 04:30
公司动态 - 公司在NVIDIA GTC 2026大会上展示了其与Wistron合作开发的最新NVIDIA驱动AI解决方案,展位号为1121 [1] - 公司展示了从板级创新到机架级集成和验证的端到端专业能力,专注于加速计算、存储和液冷技术,旨在提供具有突破性能、卓越能效和更快价值实现速度的AI工厂基础设施 [1] - 公司总裁兼首席执行官William Lin表示,公司凭借端到端的集成能力和卓越的制造工艺,能够更快地将基于NVIDIA最新平台和创新的产品推向市场,帮助客户在AI时代保持领先 [2] 技术产品亮点 - **NVIDIA Vera Rubin NVL72 AI工厂基础设施**:公司是首批准备好该全液冷、机架级平台的厂商之一,该平台统一了72个NVIDIA Rubin GPU和36个NVIDIA Vera CPU,专为前沿AI模型训练、推理和推理设计,通过极端的协同设计实现每瓦性能提升高达10倍 [4] - **NVIDIA HGX Rubin NVL8平台**:这是一个顶级的模块化加速计算平台,采用无风扇、高密度的2U设计,配备8个NVIDIA Rubin GPU和100%液冷,以实现卓越的电源使用效率,每个机架可扩展8至16个系统 [4] - **Storage-Next架构**:作为NVIDIA Storage-Next计划的一部分,该GPU发起的存储架构利用NVIDIA SCADA直接通过GPU协调96驱动器NVMe阵列的I/O,为图神经网络、大语言模型推理和检索增强生成提供超高IOPS、亚毫秒级尾部延迟和PB级密度 [4] - **NVIDIA RTX PRO服务器**:一个紧凑的2U基于Arm的平台,将双NVIDIA Vera CPU与两个NVIDIA RTX PRO 4500 Blackwell服务器版GPU配对,为神经渲染和AI驱动设计提供动力 [4] 行业合作与定位 - NVIDIA产品管理副总裁Kaustubh Sanghani指出,下一代AI创新将运行在为极致性能和效率设计的机架级加速计算平台上,并称赞公司在液冷基础设施和机架级系统集成方面的深厚专业知识,正将NVIDIA Vera Rubin平台的力量带给全球数据中心 [3] - 公司积极参与行业生态,计划于2026年3月19日太平洋时间上午10:00–10:40与YTL和NVIDIA共同举办题为“构建AI就绪数据中心:来自YTL、Wiwynn和NVIDIA的实用见解”的专题会议 [4] - 公司致力于从机架交付到集群验收的L11–L12协同工程,以加速部署并优化散热、电源和可维护性 [4] 公司背景与能力 - 公司是一家创新的云IT基础设施提供商,为全球领先的数据中心提供高质量的计算、存储和机架级解决方案 [4] - 公司以“释放数字化力量;点燃可持续创新”为愿景,积极投资下一代技术,以提供从云到边缘的最佳总体拥有成本、工作负载和能源优化的IT解决方案 [4] - 公司的端到端能力涵盖服务器设计、系统集成和大批量L10/L11机架交付,其制造网络遍布台湾、美国、墨西哥、马来西亚和捷克共和国 [4][5]
Nebius announces agreement to acquire Tavily to add agentic search to its AI cloud platform
Businesswire· 2026-02-10 23:40
收购交易核心信息 - Nebius公司宣布已达成协议收购领先的智能体搜索提供商Tavily [1] - 交易预计将在未来几周内完成 具体交易价值未披露 [1] - Tavily团队 包括其创始人兼首席执行官 将加入Nebius 产品将继续以现有品牌运营 [1] 战略与市场定位 - 此次收购旨在为Nebius的AI云平台增加智能体搜索能力 以抓住价值数十亿美元的市场机会 [1] - 收购将实时搜索基础设施整合到Nebius平台中 扩展了开发者构建企业级智能体系统所需的集成软件栈 [1] - Nebius的战略是构建一个统一平台 供垂直AI公司和企业在其中构建、微调和运行自主智能体 [1] - 公司定位不仅是基础设施即服务提供商 更是为任何希望构建AI产品、智能体或服务的人提供完整平台 [1] 技术与产品协同 - Tavily的智能体搜索技术将成为Nebius平台堆栈的关键组件 与Nebius Token Factory形成互补 [1] - Token Factory提供智能体推理所需的高性能推断 而Tavily提供确保事实准确性所需的实时网络访问 [1] - 结合高性能推断与实时信息 grounding 为下一代AI应用提供了基本构建模块 [1] - 该能力使客户能够构建可浏览网络、验证事实并执行复杂现实任务的自主智能体 无需开发者整合多个供应商 [1] 市场机遇与行业前景 - 智能体AI市场预计将从2025年约**70亿美元**增长到2030年代初的**1400亿至2000亿美元** 年复合增长率超过**40%** [1] - 智能体搜索基础设施是一个价值**数十亿美元**的机遇 预计企业部署自主AI系统将推动市场呈指数级增长 [1] - 行业预测显示 未来几年内AI智能体发出的互联网查询量将超过人类 [1] Tavily的业务表现与客户 - Tavily已通过有机的、开发者主导的增长实现了每月超过**300万次**SDK下载 显示出强大的产品市场契合度 [1] - Tavily拥有超过**100万**开发者的社区 服务对象包括财富500强企业(如IBM)以及领先的AI公司(如Cohere和Groq) [1] - 其技术为金融服务、物流和企业运营等行业的关键任务应用提供支持 [1]
Nebius to Offer NVIDIA Vera Rubin NVL72 in US and Europe From H2 2026
Businesswire· 2026-01-06 18:54
公司战略与产品部署 - Nebius公司将于2026年下半年通过其Nebius AI Cloud和Nebius Token Factory平台部署英伟达Rubin计算平台 为客户解锁下一代推理和智能体AI能力 [1] - 作为英伟达云合作伙伴 公司将成为首批提供英伟达Vera Rubin NVL72的AI云提供商之一 并将其集成到位于美国和欧洲数据中心的完整基础设施栈中 [2] - Rubin加速计算平台将通过Nebius AI Cloud提供 并作为Nebius Token Factory的计算层 这将补充现有的英伟达GB200 NVL72和Grace Blackwell Ultra NVL72算力 扩大客户针对不同AI工作负载的平台选择 [4] 技术能力与平台优势 - 英伟达Vera Rubin NVL72旨在满足复杂AI工作负载需求 包括智能体、高级推理和大规模专家混合模型 其设计目标是在长令牌序列上进行多步骤问题求解时实现最低的单令牌成本 [3] - 通过Nebius AI Cloud 客户可直接访问基础设施 获得与公司现有英伟达平台上相同的经过基准验证的裸机性能 通过Nebius Token Factory这一企业级推理和训练后平台 客户可以以可预测的延迟、性能和成本来训练、蒸馏和服务开源模型 [5] - 作为英伟达典范云合作伙伴 公司的基础设施经过英伟达参考架构和基准测试的验证 这确保客户基于Rubin的工作负载 无论是通过AI Cloud直接访问还是通过Token Factory 从首次可用起就能按设计性能运行 [6] 市场定位与客户价值 - 公司旨在为AI创新者和企业提供所需的基础设施 以更快、更高效地开发智能体和推理AI系统 [4] - 公司提供的AI原生基础设施将使客户能够充满信心地将由英伟达Rubin驱动的AI应用程序投入生产 [4] - Nebius AI Cloud专为密集型AI工作负载从头构建 凭借内部设计的专有软件和硬件 为AI构建者提供构建、微调和运行模型所需的计算、存储、托管服务和工具 [8] 公司背景 - Nebius是一家为全球AI行业构建全栈云基础设施的技术公司 总部位于阿姆斯特丹 在纳斯达克上市 在全球设有研发中心 遍布欧洲、北美和以色列 [7]