Scale Up - 财报，业绩电话会，研报，新闻

Scale Up

搜索文档

2025-12-25 10:43

涉及的行业与公司 * **行业**：光模块/光连接、AI网络互联、数据中心基础设施[1][4][5] * **公司**：英伟达（Ruby Ultra）、谷歌（I/O Superpod）、华为（Cloud Matrix）、阿里[1][4][5][9] 核心观点与论据 * **网络架构演进趋势**：AI网络互联正从**Scale Out**（负责复杂、长距离通信）向**Scale Up**（专注于高速、短距离的卡间互联）转变，这一转变推动了铜连接和正交板技术，并预示着未来将更多探讨柜内光连接方案[1][2][4] * **高密度机柜设计**：以**英伟达 Ruby Ultra**为代表，通过将576张卡拆分为4个144卡的机框，利用**正交板**和**铜线**星状连接实现内部互联，采用**Dragonfly网络架构**以优化层数、减少延时[1][6][7] * **超节点设计**：以**谷歌 I/O Superpod**为代表，采用低密度机柜（144个64卡机柜，共9,216张卡），通过光模块实现柜间**SKA**连接，使用**OCS**技术，提高了系统灵活性与性能[1][5][9] * **光连接替代铜连接趋势**：受散热、布线、承重等物理极限影响，高密度机柜内部互联未来从铜转向光的趋势明显增强，下一代产品（如**Freeman**）有望实现柜内全光设计[7][8] * **技术成本与性能比较**： * 成本：当前**硅光方案**ASP约**0.5美元/Gbps**，**EML方案**约**0.6美元/Gbps**；铜连接从DAC升级到AEC成本也会显著上升；**PCB正交板**成本低于当前大部分光模块[9][10][11] * 性能：光信号几乎无损耗，相比电信号损耗具有明显优势[11] * 未来成本展望：新兴**NPO、CPO**等技术初期价格预计在**0.3-0.4美元/Gbps**，并有望进一步下降，长期看可能实现与铜连接相当甚至更低的成本[3][11][12] * **厂商技术路径与带宽弹性差异**：不同厂商在SKA光互联实现上存在差异，反映在带宽比上：**英伟达SKU与OUT速率比约为9倍**，**华为Cloud Matrix为7倍**，**阿里为8倍**，这体现了各家在UP和OUT层数结构上的不同[3][9] * **市场规模与行业逻辑**： * **Scale Up**被认为是巨大的蓝海市场，其市场规模显然大于**Scale Out**，早期可能存在数倍差距[15] * 光模块行业具有显著的**通胀逻辑**，**Sparse光连接**是当前最大的通胀逻辑，为市场提供了新的增量空间[16] * **产业链价值分配**： * 目前整套解决方案（包括NPO）100%直接销售给云服务提供商[12] * **CPU**在生态系统中的主导权与价值量存在分歧，其最终价值取决于参与度（市场份额系数）[3][13] * 转向**光引擎**形态（如NPU、CPU、LPU）预计能带来比现有光模块更高的净利润，以补偿标准化ASP下降的影响[13][14] * **投资预期与估值**： * 行业变化（如柜内进光、超节点项目）是逐步兑现的过程，预计从2026年年中之后开始，并持续至2027-2029年[16] * 因此，投资应关注**PE（市盈率）的增加**，而非短期EPS上修[16] * 当前行业约**20倍**的PE被严重低估，考虑到超级通胀逻辑，未来应给予**30倍以上甚至40倍**的PE[17] 其他重要内容 * **Dragonfly互联技术**的作用在于优化网络层数，避免增加延时，其设计核心是满足客户对高效传输的需求[7] * 在超节点架构中，不同厂商增加光模块配比的方式不同：谷歌使用OCS技术，交换机侧无需大量光模块；华为和阿里则通过电交换机和NPU增加更多光模块端口[9]

傅里叶的猫· 2025-10-19 00:01

文章核心观点 - 文章核心观点是分析AI服务器Scale Up高速互联技术的市场格局、主流技术方案及其发展前景，重点探讨了英伟达NVLink、博通SUE和由AMD、Marvell等公司推动的UALink三大技术路线的竞争态势 [1][3][5] - 随着AI算力需求增长，Scale Up网络市场预计将从2024年的40亿美元以34%的年复合增长率增长至2029年的170亿美元，为非英伟达阵营的互联技术提供了巨大市场机会 [5][7] - Scale Up技术生态目前呈现割裂状态，未来竞争结果将取决于xPU市场份额划分、新网络标准演进以及客户的数据中心架构选择 [10][22] Scale Up和Scale Out概念 - Scale Up网络指同一台服务器或同一机架内GPU之间的高速通信网络，通过加速器互联使其协同工作，相当于一台大型超级计算机 [3] - 在Hopper时代以8卡机为主，服务器内部GPU可通信，服务器间需接交换机；Blackwell时代的GB200 NVL72则将一个机架内的72个GPU视为单一虚拟GPU，消除了服务器间通信瓶颈 [5] 主流Scale Up方案对比 - 英伟达采用专有NVLink协议实现GPU集群互联，在GB200/300的NVL72配置中，NVLink扩展至Blackwell GPU与Grace CPU的连接，预计未来将继续仅通过NVLink实现Scale Up [11] - AMD借助专有Infinity Fabric技术实现MI300 GPU的Scale Up，单个服务器最多连接8个GPU；即将推出的MI400将采用72-GPU机架配置，通过基于以太网的UALink实现Scale Up [12] - 谷歌通过芯片间互联技术实现机架内TPU Scale Up，借助光电路交换技术实现跨机架扩展；基于TPUv7架构的完整扩展pod可支持多达9216个TPU [13] - 亚马逊采用专有NeuronLink互联技术实现Scale Up通信，可在四个Trainium2实例间连接多达64个芯片；目前正与阿斯特拉实验室合作研发专用Scale Up交换机，预计2026年推出 [14] - 博通的SUE采用AI优化以太网，具备超低延迟和高性能，使用博通Tomahawk交换机，支持横向与纵向扩展的第六代产品已于6月出货 [17] - UALink是专为AI设计的内存语义互联技术，目前处于发展初期，由AMD、ALAB、MRVL及多家超大规模企业组成的联盟支持，基于AMD的Infinity Fabric，物理层依托以太网 [17] 国内超节点发展现状 - 目前国内已公布超节点方案的只有华为和阿里，华为有UB Mesh，阿里有ALink；其他国产GPU厂由于系统复杂性高且需要自有互联协议，面临较大挑战 [9] - 阿里欢迎其他厂家加入ALink生态，但其他厂家可能因竞争关系不愿兼容，同时受国际形势影响可能也不会选择国外互联总线，导致国内生态发展存在不确定性 [9] 互联介质选择：光与铜 - 当前Scale Up网络以铜缆为主，因其在短距离内具有纳秒级低延迟和成本优势，能避免光器件的额外成本和功耗 [20] - 单机架加速器部署规模上限约为72个，受架构、功耗与散热、物理密度和可靠性四大因素限制；若规模超过100个或需转向光连接 [20] - 预计铜缆将在Scale Up网络中长期使用，但当Scale Up突破单机架实现数百个GPU集群时，可能于2028年及以后引入光器件 [20][21] 市场竞争格局与关键因素 - Marvell在UALink生态中的主要贡献是准备做UALink switch，这是整个生态中最关键的一环 [22] - 当前市场处于早期阶段，架构、技术标准和客户偏好仍在变化中，最终胜出的Scale Up技术尚未确定，但市场规模足以支撑多家供应商共存 [22] - 长期来看，非英伟达阵营预计将从专有Scale Up网络逐步转向UAL、SUE等开源解决方案，这些技术有望在2027-2028年随着技术成熟及新ASIC产品放量而得到更广泛应用 [22]

More and more of our innovations are being adopted, at higher and higher value, says Corning CEO

Youtube· 2025-09-13 07:41

公司股价表现 - 过去12个月股价上涨84% [2] 数据中心业务增长 - 数据中心业务是当前增长最快的业务板块 [4] - 业务增长主要基于网络横向扩展(scale out)需求 [4] - AI集群互联推动光纤需求增长 [5] - 长距离传输时光纤比铜缆更具技术经济性 [6] - Meta路易斯安那数据中心园区需要800万英里光纤 [7] - 该光纤长度可绕地球赤道320圈或连接纽约州所有独栋住宅 [8] 技术发展机遇 - 服务器背板采用玻璃可提升能效和晶圆利用效率 [10] - 纵向扩展(scale up)市场规模是横向扩展的2-3倍 [11] - 公司正全力投入相关技术创新 [10] - 数据中心互联推动长途网络重建需求 [12] 消费电子业务 - 移动消费电子产品采用更多康宁创新技术且价值量提升 [13] - 获得苹果2.5亿美元投资专门用于移动消费电子研发设施 [17] 新能源业务布局 - 在密歇根州建设美国最大原生多晶硅晶圆工厂 [14] - 太阳能业务季度运行率约2亿美元 [14] - 预计到明年末运行率将提升至三倍 [14] 地缘政治影响 - 美国市场90%收入来自本土生产产品 [16] - 仅1%在美销售产品在中国制造 [16] - 关税政策对公司影响极小 [15] 资本配置策略 - 苹果投资释放股东资本可用于其他创新领域投资 [18] - 释放资金将重点投入网络纵向扩展等创新项目 [18]

康宁(US:GLW)

Artificial Intelligence

Artificial Intelligence

让64张卡像一张卡！浪潮信息发布新一代AI超节点，支持四大国产开源模型同时运行

量子位· 2025-08-11 15:48

国产开源模型发展 - 国产开源模型如DeepSeek R1、Kimi K2等在Hugging Face热度榜及关键指标（推理能力、长文本处理、多模态理解）上表现突出 [1] - 主流开源模型参数量突破万亿级别，显存需求达数TB量级 [1] - Agentic AI范式推动多模型协同与复杂推理链，计算与通信需求爆炸式增长 [2] 元脑SD200技术突破 - 浪潮信息发布超节点AI服务器元脑SD200，支持单机运行四大国产开源模型及超万亿参数推理 [3][5] - 64卡整机实现超线性扩展（DeepSeek R1推理性能提升3.7倍，Kimi K2提升1.7倍） [6][11] - 采用3D Mesh开放架构，通过Open Fabric Switch实现64卡统一编址，显存达4TB，内存64TB [7][8] - 百纳秒级低延迟通信，支持原生内存语义对齐，优于业界主流方案 [8] - 内置Smart Fabric Manager优化全局路由，PD分离框架提升推理效率 [9] Agentic AI对基础设施的挑战 - 智能体AI需多模型协同（如代码生成、逻辑推理、知识检索模型），交互频次与计算量激增 [14][15] - 万亿参数模型跨机通信延迟问题突出，传统InfiniBand网络难以应对高频小数据包场景 [15][16] - 元脑SD200通过统一计算域与8倍地址空间扩增，解决显存容量与延迟问题 [19] 超节点设计理念 - Scale Up路径选择：硅基芯片性能提升受限，Scale Out架构高延迟问题显著 [20][21] - 元脑SD200在有限物理空间内聚合64路GPU，平衡物理定律与工程实践 [22][24] - 系统化设计整合现有技术，最大化用户价值 [22] 开放生态战略 - 基于OCM（开放算力模组）与OAM（开放加速模块）架构，支持Intel、AMD、ARM等多平台及异构加速器协同 [25][27][29] - 兼容PyTorch、vllm等主流框架，降低用户迁移成本 [11][32] - 推动"智能平权"，通过开放架构降低企业使用门槛，共享AI技术红利 [33][34][35]

21世纪经济报道· 2025-07-31 08:38

超节点技术兴起背景 - AI大模型发展推动算力需求进入万卡协同时代万亿参数模型和多模态训练对算力提出更高要求[1] - 传统算力架构难以满足高效低耗大规模协同的AI训练需求行业亟需技术革新[1] - 超节点作为Scale Up纵向扩展解决方案由英伟达率先提出具有高性能低成本高能效优势[1] 超节点技术优势 - 通过内部高速总线互连支撑并行计算任务加速GPU间参数交换和数据同步缩短大模型训练周期[1] - 深度整合GPU资源构建低延迟高带宽的统一算力实体[2] - 采用液冷等先进散热技术将数十甚至上百计算单元高度集成极大提升算力密度和能源效率 PUE值优化[2] - 相较于Scale Out横向扩展方案在性能成本组网运维等方面存在优势[2] 连接方案发展 - 铜连接成为超节点主要承载载体具有高成本效益和运营可靠性[2] - 铜缆已实现224G以太网SerDes高速通信技术升级短距离传输性价比突出[3] - 英伟达GB200 NVL72服务器采用大量铜连接机柜内部使用电缆长度累计接近2英里(约3.2公里) 包含5000多条独立电缆[3] 技术方案分类 - 业界主流超节点方案分为私有协议和开放组织方案[3] - 私有协议包括英伟达Trainium方案和华为方案等[3] - 开放标准以以太网技术为基础 ODCC主导的ETH-X项目分为Scale Up和Scale Out两个组网部分[4] 中国企业布局 - 华为发布昇腾384超节点实现业界最大规模384卡高速总线互联具备超大带宽超低时延超强性能优势[5] - 曦智科技联合壁仞科技中兴通讯推出全球首个分布式光互连光交换GPU超节点解决方案光跃LightSphereX[5] - 燧原科技云燧ESL超节点系统单节点最高64卡全带宽互联采用液冷方案[5] - 沐曦发布旗舰GPU曦云C600 支持MetaXLink超节点扩展技术[5] - 摩尔线程建立全栈AI智算产品线包含AI超节点服务器及夸娥智算集群[6] - 字节阿里腾讯新一代服务器均采用超节点设计[4] 市场前景 - 超节点被国内外众多服务器选为下一代方案[2] - 中国科技企业在超节点领域全面开花标志算力集群正式迈入万卡协同时代[1] - 超节点技术为全球人工智能发展铺设兼具性能与包容性的新赛道[6]