AI 推理算力
搜索文档
全球科技硬件调研汇报
2026-03-24 09:27
全球科技硬件调研汇报 20260322 电话会议纪要分析 涉及的行业与公司 * **行业**:全球科技硬件,涵盖AI算力基础设施、半导体(特别是存储)、光通信、高端印制电路板(PCB)等。 * **公司**:英伟达、Groq、海力士、铠侠、西部数据、东京电子、Kokusai(国际电气)、韩美半导体、EO Technix、ASMPT、Lumentum、康宁、中际旭创、新易盛、Coherent、光迅科技、华工科技、天孚通信、Marvell、Arista、长飞光纤、Siana、HyperLight、瑶光电、赛勒科技等。 核心观点与论据 AI 算力发展趋势与英伟达新产品 * **AI算力需求从训练转向推理**:行业需求正从训练主导转向推理驱动,预计未来三年推理所需算力将达到ChatGPT初始版本的1万倍[1][2] * **数据中心市场规模将大幅增长**:预计2027年数据中心市场规模将突破1万亿美元,从2025-2026年的5000亿美元跃升[1][2] * **英伟达发布Veloce计算平台**:由Rubin/Rubin Ultra GPU、Vera CPU、BlueField-4 DPU(或ConnectX-9超级网卡)构成,应对推理算力拐点[2] * **Rubin GPU侧重推理优化**:通过增大片上SRAM,在单用户每秒处理200-400个token的高并发场景下,其每瓦性能相比上一代Blackwell提升了10倍[1][2] * **Vera CPU专为Agent任务设计**:旨在将检索、Python执行、外部调用等工具负载从GPU卸载,使GPU更专注于矩阵计算[1][2] 专用AI推理芯片与协同挑战 * **Groq-3 LPU解决解码瓶颈**:作为专用芯片,旨在解决大模型推理中Decoding阶段的带宽瓶颈,该阶段承载超过60%的参数量[3] * **LPU架构特点**:单芯片集成500MB片上SRAM,可通过Chip-to-Chip链路实现机柜内高效扩展,256颗LPU集群可形成128GB片上SRAM池并配合12TB DDR5内存[3] * **LPU与Rubin协同方案存在潜在问题**:一是以太网连接在重任务下时延表现可能不佳;二是BlueField-4 DPU与LPU的互联可能涉及不成熟的PCIe Gen4到Gen6协议转换[3][4] * **AI芯片向高度专用化、解耦化和异构化发展**:尽管协同方案相比Blackwell已有显著提升,但仍有优化空间,预示此发展方向[5] 高端PCB产业迎来新机遇 * **Rubin平台推动PCB量价齐升**:其全盲插无线缆设计将互联压力转移至更高规格PCB系统,单颗GPU对应的PCB总价值相比GB200提升了30%以上[1][5] * **Groq LPU集群带来新增量**:其高密度互联需求需要支撑256颗芯片间高速互联,预计LPU托盘PCB将采用M9等级材料和50层以上高多层板设计,单颗LPU对应的PCB价值约200美元[5] * **正交背板价值量巨大**:在NVL144等超高密度机柜中取代铜轴电缆,单块正交背板PCB价值量达3-4万美元,单柜配置4块总价值达12-16万美元,折合每颗GPU贡献超过500美元PCB价值[1][6] 半导体行业周期与存储市场新趋势 * **当前周期为AI驱动的结构性增长**:2025-2026年周期核心驱动力是AI及生成式AI的推理应用以及端侧AI手机换机需求,而上一轮(2020-2023年)由消费电子和云服务等普遍性需求驱动[6] * **当前供给瓶颈高度集中于先进制程**:包括3纳米、2纳米等先进工艺节点、CoWoS等先进封装产能、HBM和高密度企业级存储,而上一轮瓶颈在于28纳米及以上成熟制程的"缺量"[6][7] * **资本开支更具针对性**:当前投资集中于AI相关高附加值产线、特定核心设备及区域化安全需求领域,而上一轮因断供风险和恐慌性备货引发广泛但针对性不强的产能扩张[7] * **存储行业扩产受限于无尘室空间**:无尘室建设周期压缩至1-1.5年,但从建成到量产仍需额外两到三个季度,海力士韩国龙仁集群预计2027年Q3或Q4才能量产,空间不足问题将持续存在[7] * **产能分配优先级明确**:产能优先分配给价格和利润更高的DRAM或HBM,NAND整体优先级靠后,预计将处于供不应求状态[8] * **扩产侧重代际迁移**:存储行业扩产更侧重于向300层、400层节点等代际升级,而非单纯新增原有产能,预计2026及2027年市场将处于供应受限或紧平衡状态[8] * **NAND价格大幅上涨**:2026年第一季度NAND价格实际涨幅已超过60%,定价策略从年度固定价格转变为季度谈判[9] * **长期协议约束力可能增强**:目前长协约束力不算特别强,但未来可能会逐步增强,客户当前愿意接受锁定供应量的协议,但在价格方面仍无法完全确定[9] 半导体设备与先进封装技术迭代 * **前道设备需求增长与单价提升**:器件复杂度提升和快速代际迁移催生新设备需求,Kokusai在1c纳米级别的新设备单价预计提升30%-50%,部分小批量设备单价甚至可能翻倍[10] * **Kokusai预计高速增长**:预计其2027财年非中国区的DRAM纯设备业务增速将达到60%以上,整体增速在20%以上[10] * **东京电子目标明确**:目标拿下NAND 400层以上市场20%-40%的份额,在涂胶显影机市场已拥有超过90%的份额,并快速开发适用于2纳米GAA和HBM EUV的工艺[10] * **后道先进封装设备要求提高**:HBM堆叠层数增加对键合和激光加工设备提出更高要求,韩美半导体在HBM设备市场份额超过60%,其TCB设备单价每代涨幅在15%-20%左右[10] * **混合键合技术成本高昂且落地较晚**:预计成本将是当前的5倍以上,大规模应用可能要到2029年或2030年左右,目前主流技术仍停留在宽型TCB或无焊剂TCB领域[10] 存储架构创新应对AI需求 * **应对AI数据读取新要求**:铠侠采用低延迟的XL-Flash和超高IOPS的SSD方案,并采用QLC闪存满足训练服务器数据摄取需求[11] * **HDD在温冷数据存储中仍具不可替代性**:西部数据已将HDD的长期容量增长预期上调至20%的中段水平[11] 光通信行业核心趋势 * **产业界对AI周期信心强烈**:2026年OFC大会规模达历史峰值,关键热词包括Scale-up、CPO、NPO、Scale-across、OCS、XPO等,代表下一阶段重要发展趋势[12] * **CPO与NPO技术受关注**:产业链各环节均展示了相关技术实力,中国企业在FAU、ELS模块、光引擎封装等环节表现出产业引领地位[12] * **NPO方案预计2027年放量**:基于其在维护成本、可靠性和产业链复制方面的优势,预计2027年部分CSP客户的Scale-up场景将开始规模化放量NPO订单[13] * **非主流方案百花齐放**:如Coherent的Socket CPO方案和基于VCSEL的Scale-up CPO方案,体现了工程学折中思路和解决供应链紧缺的"宽而慢"连接思路[13] CPO技术商用挑战与放量节奏 * **CPO商用面临多重挑战**:包括技术层面产业链规模化能力稚嫩、散热、良率和可靠性问题,以及工程层面维护不便和实际TCO成本较高等[14] * **CPO在Scale-up场景意义更突出**:由于对"海岸线密度"和单位带宽功耗的要求远高于Scale-out场景,CPO在Scale-up增量场景中的应用意义更为明确[14] * **主流判断CPO随英伟达平台更迭放量**:Scale-up CPO有望在2027年下半年到2028年内,随着英伟达从Rubin Ultra到Fermion平台的代际更迭而率先实现放量[15] * **英伟达明确光路进入机柜趋势**:Rubin Ultra 576架构将采用光铜混合连接,下一代Fermion平台计划在Switch Trunk中直接搭载NVLink 8 CPO交换芯片[15] * **CPO市场规模预期大幅上调**:Coherent将对2030年CPO全球市场空间的预测从一年前的50亿美元大幅上调至150亿美元,主要增量预期来自Scale-up CPO趋势的明确[1][15] XPO技术特点与前景 * **XPO为高密度、液冷形态可插拔光模块**:Arista牵头成立XPO/MSA组织,旨在为下一代AI数据中心定义该新形态[16] * **XPO核心优势**:可实现4倍的前面板交换密度提升;原生液冷设计单模块最高可支持400W以上散热能力;保留了可插拔模块可直接热插拔的便利性[16][18] * **XPO有望延长可插拔方案生命周期**:其向更高密度、更低功耗和原生液冷路径的演进,打破了传统风冷可插拔模块的物理瓶颈[17] * **XPO预计2027年前后放量**:结合其产业链复制和热插拔属性,判断有望在2027年前后获得下游客户认可并实现初步放量[17] Scale-across网络架构与挑战 * **Scale-across受关注原因**:随着大模型训练集群向10万卡甚至更高数量迈进,单一数据中心的电力负荷和物理空间逼近极限,使得跨数据中心连接至关重要[17] * **Scale-across与WAN DCI区别显著**:Scale-across用于后端连接,将分散数据中心整合成逻辑上的大型AI超级工厂,其对带宽要求是传统WAN DCI场景的14倍(连接100万个XPU)[19] * **对光系统提出高要求**:需要支持超高光纤密度,并尽可能减少中继放大器带来的延迟、功耗和成本,例如Siana的Hyperion连接方案密度可达传统方案的32倍,功耗降低75%,空间需求减少85%[19] * **空心光纤需求提升**:传统实心单模光纤会限制分布式数据中心微秒级参数同步,因此提升了对空心光纤等高速传输方案的需求,长飞光纤展示的空心光纤产品衰减已从0.05 dB/km进一步降低至0.04 dB/km[19] Coherent Lite技术应用前景 * **Coherent Lite适用于Scale-across场景**:它是一种专注于2至40公里传输距离的轻量化相干技术,使用1310纳米波长的O波段[20] * **技术优势**:通过限制DSP均衡复杂度,能够实现超过10倍的延迟降低和两倍的功率效率提升[20] * **应用有望扩展**:未来还有望逐步扩展到Scale-out的Spine层以及DCI场景中[20] * **产业链潜在受益方**:中游具备较强模块制备能力的头部厂商,以及上游提供相关DSP芯片的头部企业(如Marvell)有望受益[20] 光路交换技术(OCS)新趋势 * **OCS应用场景延伸**:市场对于OCS在Scale-up场景中的应用拓展已形成初步共识,从最初设想的Scale-out Spine层进一步延伸[21] * **市场规模预期显著上调**:Lumentum预计到2027年其OCS业务的run rate将超过10亿美元;Signal AI测算2029年OCS市场规模将突破25亿美元;Coherent将对2030年全球OCS市场规模的预期从20亿美元上修至40亿美元[22] 单波400G时代光调制器材料趋势 * **薄膜铌酸锂异质集成成为确定性趋势**:产业共识认为,将薄膜铌酸锂与硅光进行异质集成是下一代单波400G的确定性发展趋势,相比传统方案具备高带宽、低驱动电压和高线性度优势[1][22] * **技术进展与功耗优势**:HyperLight展出了由天孚通信组装的、基于薄膜铌酸锂PIC的1.6T DR8光模块,整体功耗仅为20瓦,相比传统方案降低了约20%[1][22] * **产业主流观点明确**:薄膜铌酸锂加异质集成将是400G per lane时代的必然趋势,而对砷化镓方案则持谨慎观察态度[23] * **产业链各环节存在机会**:薄膜铌酸锂产业链涵盖上游材料设备、中游调制器芯片与器件、下游模块及终端设备,具备增量弹性的在位企业值得关注[23] 其他重要但可能被忽略的内容 * **半导体设备市场增速受制约**:根据与东京电子的交流,客户无尘室空间不足以及存储芯片的某些反向制约因素,导致2026年半导体设备市场的实际出货预期约为15%,未能满足的设备采购需求将顺延至2027年[7] * **激光设备领域进展**:韩国EO Technix在飞秒激光开槽等方面具备领先优势,并预期在2027年实现明确的业绩增长[10] * **Coherent Lite技术展示**:Lumentum联合Marvell展示了其R300 OCS平台,可与Marvell的1.6T Coherent Lite DSP、1.6T PAM4 DSP及ZR DCI模块实现互操作[22] * **纯硅光方案仍有坚持者**:仍有厂商在坚持纯硅光方案,例如Coherent和国内PIC厂商赛勒科技展示了400G per lane纯硅光方案的构想[23]