英伟达GTC大会的核心看点,谁是最大受益方?

英伟达GTC大会技术路线与供应链分析 - 文章核心观点在于分析英伟达GTC大会未受广泛关注的技术路线转变与供应链布局,指出其战略重心已从模型训练(prefill)加速转向推理加速,并强调在智能体时代,对产能和供应链的掌控是公司的核心护城河 [1][3][14] 产品路线变更:CPX被LPU取代 - 此前传闻将采用HBM的CPX项目已被取消,由LPU(推理处理单元)取代 [2] - 这一变更源于英伟达技术路线的根本转换,即从注重预填充(prefill)加速切换至专注于推理加速 [3] 供应链受益方:三星电子 - 三星电子成为GTC大会后最大受益方,因其独家获得LPU的代工订单,采用三星的4纳米(N4)工艺 [4] - 在Rubin平台中,三星提供的综合价值量(包括存储和代工)已超过仅负责代工与封装的台积电 [4] LPX机架架构创新 - LPX机架中引入了FPGA(现场可编程门阵列) [6] - FPGA的作用在于实现精密的协同架构,确保256颗LPU能作为一个单一的巨型处理器运行,从而实现低延迟、确定性的推理加速 [6] 独立的CPU与存储机柜战略 - 设立独立CPU机柜是为了适应智能体时代的需求,为智能体的自主工作(如调用工具、执行代码、强化学习)提供海量的“沙盒”测试环境 [7] - 单个CPU机柜集成256颗CPU,可同时维持超过22,500个并发的智能体测试与验证环境,弥补了GPU在处理复杂单线程逻辑上的短板 [7] - 设立独立存储机柜是为了解决智能体时代模型处理超长上下文(数百万token)导致的KV Cache数量线性暴增问题 [8] - 将海量KV Cache全部存放在HBM中容量受限且成本高昂,卸载到传统企业存储则功耗大、延迟高,会导致GPU闲置 [11] - 英伟达采用分级存储架构,其ICMS(推理上下文内存存储)方案作为整个AI集群的长期记忆库,专门优化海量临时KV Cache数据的存储、检索和共享,并通过高速RDMA网络预加载数据至GPU内存,避免历史数据重复计算,显著提升效率 [13] 战略核心:产能与供应链掌控 - 抛开技术参数,公司最关注的底层护城河是产能与供应链 [14] - 公司管理层近期频繁前往亚洲,主要目的是为了锁定存储、晶圆代工和先进封装(如CoWoS)的产能 [14] - 公司在供应链管理上的优势被描述为其他企业望尘莫及 [14] - 谷歌向Anthropic出售TPU后内部算力紧缺的案例,以及OpenAI积极寻求产能合作的行为,均印证了在AI算力成为“企业命脉”的当下,对底层产能的绝对把控力是决定竞争胜负的关键 [16]