Workflow
Vera CPU 机架
icon
搜索文档
推理利器LPX问世,AgentAI、太空算力架构迎革新
东方证券· 2026-03-19 23:00
报告行业投资评级 - 电子行业评级为“看好”(维持)[7] 报告核心观点 - 2026年GTC大会英伟达发布多项创新产品,包括Vera Rubin POD、Groq 3 LPX推理机架、Vera CPU机架及太空计算模组,这些革新将推动AI推理、Agent AI及太空算力发展,并带动PCB、液冷、供电、光通信等产业链需求[3][10][13] - 在通信架构上,短期一层scale up域内铜缆是较优解,双层架构则需铜光配合,高算力密度的Kyber架构将采用正交背板,scale out场景下CPO方案逐步成熟[3][30] - 散热方面,高密度AI场景风冷已退出,Vera Rubin POD中五种机架均采用**100%全液冷**[3][31] - 供电方面,**800V HVDC** 正从“可选”成为“AIDC标配”[3][31] - 太空算力方面,英伟达加入并优化设计,有望推动生态成熟,加速太空IDC发展[3][31] 根据目录总结 1. 英伟达新发LPX、CPU机架,推理、Agent AI、太空算力架构迎革新 - **Vera Rubin POD发布**:包含5种机架级系统,拥有40个机架、**120万亿晶体管**、近**2万颗** NVIDIA芯片、**1152颗** NVIDIA Rubin GPU、**60 Exaflops**算力及**10PB/s**的总scale up带宽,公司预计到**2027年总订单额将达到1万亿美元**(2025年预计约为**5000亿美元**)[13] - **推理利器Groq 3 LPX**:专注低时延推理任务,单个机架包含32个液冷1U compute tray,提供**315 PFLOPS** AI推理算力、**128GB**总SRAM容量及**640TB/s**总scale up带宽,其LPU(LP30)带宽高达**150TB/s**,约为Rubin带宽的**7倍**,通过与Rubin GPU协同(Dynamo架构),在高端模型上相较于Blackwell可提供**超35倍**的每兆瓦tokens处理能力和**超10倍**的营收机会[10][17][20] - **Vera CPU机架**:包含32个液冷CPU tray,合计**256颗** CPU,提供**400TB**内存、**300TB/s**内存带宽,单线程性能比传统x86 CPU提升**50%**,单个机架可支持**超过22500个**并发强化学习或Agentic沙箱环境,性能比传统机架规模CPU高效**两倍**且速度快**50%**,旨在支持大规模AI Agent部署[10][24] - **太空计算与Kyber架构**:英伟达研发**Space-1 Vera Rubin Module**太空计算模组,并公布**Rubin Ultra Kyber**架构,采用正交背板互联,Kyber NVL144通过光互连支持scale up至NVL1152,算力密度持续提升[10][29] 2. 技术架构演进与产业链需求影响 - **通信架构**:Scale up域内,铜缆短期是较优解;若采用双层架构则为铜+光配合;高算力密度的**Kyber架构**采用正交背板;Scale out场景下,**CPO方案**逐步成熟[3][30] - **散热架构**:高密度AI场景下,风冷已彻底退出,**Vera Rubin POD中五种不同机架均采用100%全液冷**,将带动冷板、快接头等需求,为未来**1MW级机柜**铺路[3][31] - **供电架构**:**800V HVDC**供电方案已全面落地,成为AIDC标配,多家厂商展示可为单机柜提供**200-600kW**稳定电力的Sidecar电源系统[3][31] - **未来产品路线**:包括Rubin Ultra、LP35 LPU、Feynman GPU(2028年量产)、LP40 LPU、Rosa CPU、NVLink 8 CPO等,将持续提升网络带宽与计算性能[13][29] 相关投资标的 - **PCB相关厂商**:沪电股份、胜宏科技、景旺电子、深南电路、方正科技、中富电路、鹏鼎控股(买入)、东山精密(买入)等[4] - **CPO相关厂商**:源杰科技、长光华芯、仕佳光子、光迅科技、天孚通信、太辰光、致尚科技、长芯博创等[4] - **液冷相关厂商**:英维克、领益智造(买入)、申菱环境、高澜股份、思泉新材等[4] - **太空算力相关厂商**:复旦微电(买入)、成都华微等[4]
英伟达全新AI平台Vera Rubin亮相,单 Token 成本降至 1/10
环球网资讯· 2026-03-17 11:51
公司战略与产品发布 - 英伟达在GTC大会上正式发布专为智能体AI发展打造的Vera Rubin AI平台[1] - 该平台被视作公司在AI基础设施领域的代际飞跃,标志着其开启史上最大规模的AI基建布局[1] - 平台旨在全面覆盖从大规模预训练到实时智能体推理的AI全生命周期,为智能体AI技术发展提供算力与技术支撑[1] 平台核心技术突破 - 平台在核心算力、推理加速、数据存储等多个维度实现技术突破,从底层优化AI全流程运算效率[3] - 核心算力层面,新一代NVL72机架通过NVLink 6连接72块Rubin GPU与36块Vera CPU[3] - 相较于上一代Blackwell平台,新系统完成混合专家大模型训练仅需四分之一的GPU[3] - 新系统每瓦推理吞吐量提升10倍,成功将单Token成本降至原来的十分之一[3] - 专为验证AI模型结果设计的Vera CPU机架集成256块液冷CPU,运行效率达到传统CPU的两倍,运算速度提升50%[3] 推理加速与延迟优化 - 针对智能体系统低延迟、长上下文需求,公司同步推出Groq 3 LPX推理加速机架[4] - 该系统配备256个LPU处理器,与Vera Rubin平台结合后,每兆瓦推理吞吐量最高可提升35倍[4] - 该技术有效解决智能体AI运行过程中的延迟问题,适配长上下文的运算需求[4] 数据存储与架构升级 - 全新BlueField-4 STX机架构建起AI原生存储基础架构[4] - 依托全新的DOCA Memos框架,系统能高效处理大型语言模型生成的海量键值缓存数据[4] - 新存储系统在显著降低能耗的同时,将推理吞吐量最高提升5倍[4] - 该升级让AI多轮交互的响应速度大幅加快,更好地匹配智能体AI的实际应用场景[4]