Workflow
电子行业点评报告:百万Token时代来临,RubinCPX重塑推理架构与产业链

行业投资评级 - 电子行业评级为增持,且维持该评级 [1] 核心观点 - Rubin CPX 的推出标志着百万 Token 时代来临,其将重塑推理架构与产业链 [1] - Rubin CPX 是专为百万级上下文推理场景设计的专用加速处理器,通过硬件与架构优化提升对超长上下文场景的吞吐与能效 [7] - 上下文与生成任务分工协作的新阶段开启,算力产业链价值量同步上升,海外算力链受益加速 [3] - 长上下文推理为行业带来新增长动能,Rubin CPX 的量产与落地将成为全球算力需求加速释放的重要信号 [3] 技术参数与性能 - Rubin CPX 单卡提供约30 PFLOPS算力(NVFP4精度),并搭载128GB GDDR7显存,同时内置视频编解码能力,可满足多模态场景需求 [2] - Vera Rubin NVL144 CPX 系统由144张CPX、144张Rubin GPU和36个Vera CPU构成,整体性能指标达到8 ExaFLOPS算力、100TB高速内存与1.7PB/s内存带宽 [2] - 相比上一代GB300 NVL72系统,Vera Rubin NVL144 CPX在上下文处理效率上实现数倍提升 [2] - Rubin CPX 预计将在2026年底上市,与Rubin GPU及Dynamo、TensorRT-LLM等软件工具链一体化部署 [2] 产业链影响与受益领域 - 硬件和软件耦合度显著提高,算力产业链价值量同步上升,相关厂商有望深度受益 [3] - 受益领域包括GPU、存储、网络、高速PCB、光模块与封装工艺等 [3] - 产业链相关公司涵盖PCB/CCL(沪电股份、胜宏科技、生益电子、深南电路、景旺电子、广合科技、生益科技、南亚新材)、铜缆(沃尔核材、博创科技、华丰科技)、光芯片/光器件(博创科技、仕佳光子、太辰光、长光华芯、源杰科技)以及服务器代工(工业富联、华勤技术) [3] 架构优化与分工协作 - Rubin CPX 负责上下文处理加速,对海量输入做高通量注意力与前置计算,而Rubin系列通用GPU负责生成/输出阶段的持续带宽密集型任务 [7] - 上下文分析更依赖并行化处理和带宽利用,生成任务要求对计算延迟与单步性能进行极致优化 [7] - 上下文与生成任务分工协作实现算力利用率与效率提升,进而降低推理成本并加速推理响应 [7]