GTC大会新架构与核心技术要点解读

行业与公司 * 本次电话会议纪要主要围绕英伟达在GTC 2026大会上发布的新一代产品与技术展开，涉及人工智能（AI）计算硬件行业，核心是英伟达公司[1][2][3] * 会议详细解读了其新发布的Feynman架构、Rubin/Rubin Art GPU、VeraWell CPU、LPU等产品，并讨论了相关散热、互联、存储技术及对下游产业链（如ODM、PCB、光模块、HBM供应商） 的影响[1][2][3][4][5][6][7][8][9] 核心产品性能与架构提升 * Feynman架构：采用1.6纳米制程，通过CPO交换机互联，旨在解决大规模AIG集群柜间互联瓶颈与能耗问题，实现的带宽密度有近10倍的提升[1][2] * Rubin GPU：推理速度达50 PetaFLOPS，性能约为前代Blackwell的12.5倍[2] * Rubin Art 机柜：如NVR72架构的机架性能约为GB200的14倍；Rubin Art 576整体推理性能相比Blackwell架构提升约14倍[2] * VeraWell CPU：效率相比英特尔和AMD最新的CPU高出近两倍，核心数翻倍至88核[1][3][4] * LPU (推理处理单元)：与Rubin GPU搭配用于推理场景时，能使整体推理性能提升约35倍，吞吐量最多可提升50倍[1][6] * 成本与效率：新一代产品在算力大幅提升的同时，Token成本相较前一代产品降低了近90%；LPU采用SRAM/DDR5替代HBM，可使单位Token成本降低至少80%[1][3][6][11] 技术趋势与行业影响 * 模块化与集成化：新产品（如NV Switch和Rubin节点）高度模块化，服务器组装时间从原先的两天缩短至约两个小时，这削弱了ODM厂商的自主空间，其业务重心由组件制造转向整机柜集成[1][3][4][5] * 散热技术：散热方案全面转向100%液冷，采用45度温水进行冷却，以降低电力成本[1][3][4][5] * 互联技术：呈现铜光并存趋势。机柜内未来3-4年仍以铜互联为主（224G/448G）；CPO渗透预计2027年大规模交付，2028-2029年成熟部署，成本是主要考量[1][5][9] * 软件框架：Nemo Cloud框架相比OpenAI框架，在安全性（内部开源）和与英伟达GPU平台的兼容性与效率上具备优势[4] * AI应用：Agent AI的应用被视为开启智能体的新拐点，预计将成为未来关注焦点[3] 供应链与硬件需求变化 * HBM存储： * Ruby架构采用HBM4，Ruby Arch将采用HBM4E，存储容量约288GB[7][8] * 海力士是HBM4量产进度最快的厂商，其12层HBM4产品已于2026年第二季度实现量产；HBM4E预计2027年第二季度推出[1][8] * 三星整体交付进度较慢，预计2026年第三季度左右进行验证和交付；美光进度更晚，大批量交付可能要到2026年第三或第四季度[8] * HBM市场存在接近20%的结构性短缺，因其占用了约30%至40% 的原有DRAM产能[1][8] * PCB（印制电路板）：LPU的应用对服务器硬件提出更高要求，其所使用的PCB板层数会显著增加，预计将达到40至50层，提升了PCB的价值量[1][6] * 光模块：CPO等新技术的发展可能影响传统光模块市场，未来的800G和1.6T硅光模块可能向可插拔形式演进，传统带DSP功能的光模块价值量可能受到压缩[9] 其他重要信息 * Spectrum交换机：用于超大规模集群互联，关键技术包括自适应路由和通过AI控制网络拥塞，实现算力均衡分配[7] * 替代存储方案：业界探索使用PCIe 6.0带宽将DDR5内存作为缓存扩展的策略，以应对部分推理场景并降低成本，但无法满足训练场景[8] * 国内供应链：在HBM领域，海外厂商仍占据主导地位，国内厂商进展尚不顺利[8] * LPU部署形式：LPU目前采用风冷即可，短期内与GPU集成在同一模块的可能性不大，分体式部署有利于降低故障维修成本[6]