互联技术
搜索文档
CPO,过热了?
半导体行业观察· 2025-12-25 09:32
文章核心观点 - 行业普遍认为共封装光学(CPO)是未来数据中心高速互联的终极技术方向之一,但其大规模商业应用的时间点被大幅推迟,短期内不会成为主流 [1][23][27] - 当前AI基础设施的竞争重心已从单纯堆叠算力转向互联与系统能力,但CPO并非解决当下瓶颈的迫切方案,可插拔光模块等现有技术路径仍有巨大演进潜力和生命力 [3][4][24] - 超大规模云厂商等客户对部署CPO态度谨慎,主要顾虑包括可维护性、系统设计复杂度、成本、供应链成熟度以及现有运维体系的惯性,CPO的部署窗口与客户的实际业务节奏存在错配 [18][20][22][26] AI基础设施瓶颈转向互联与系统能力 - AI集群规模正朝超大型化发展,博通透露其客户正在规划和部署规模超过10万颗GPU的集群,而行业内部讨论的目标已指向百万GPU级别 [3] - 随着模型参数与集群规模指数级扩张,AI集群的核心瓶颈从计算能力转向互联能力,通信效率、延迟、系统稳定协同成为决定算力能否有效利用的关键 [3] - 行业竞争重心从算力本身全面迈向互联与系统能力,关键词变为横向扩展、纵向扩展、跨域扩展以及功耗墙、链路可靠性、系统级协同设计等工程化概念 [4] 横向扩展领域:可插拔光模块仍将长期主导 - 博通首席执行官指出,未来5-7年可插拔光模块仍将占据主导地位,800G技术增长周期持续至2026年,1.6T产品预计增长至少持续到2029年,3.2T技术已完成展示 [7] - Lumentum预测2026年光端口总量将达到6000万-7000万个,同比增长接近翻倍,其中800G端口占55%-60%,1.6T端口占15%-20%,800G仍是绝对主流 [7] - Marvell指出,在传输距离较长、需要互操作的市场中,可插拔产品采用速度较慢,但其软件预认证带来的生态优势是核心护城河,客户从400G向800G的迁移“几乎是即时完成的” [8] - Arista表示在1.6T速率下仍有信心实现低功耗光模块的稳定运行,同时共封装铜缆等技术也在评估中,率先推出下一代速率产品并快速商业化是其核心策略 [8] 纵向扩展领域:CPO量产时间表大幅推迟 - 纵向扩展曾是CPO最有希望应用的“第一战场”,但量产时间表已被大幅推迟至2027-2028年及以后 [9] - Marvell收购Celestial AI后给出新营收目标:2027年底年化营收达5亿美元,2028年底翻倍至10亿美元,大规模商业部署相应推迟 [9] - Astera Labs预计CPO在纵向扩展领域的大规模部署将在2028-2029年实现,2027年将进行一些测试性部署 [9] - 推迟原因包括:CPO供应链仍较新,需要时间提升产能以支持大规模需求;纵向扩展场景的需求将是现有需求的数倍,需要整个行业共同努力扩大产能 [9] 功耗与可靠性是更现实的约束 - 客户不愿转向光学技术是因为其需要更高的功耗和成本,行业会优先通过机柜内铜缆和可插拔光模块实现纵向扩展,只有当它们都无法满足需求时,硅光子技术才会成为必然选择 [10] - Credo举例,xAI因铜缆解决方案绝对稳定可靠,提出构建“零中断”集群的需求,促使行业重点攻克GPU与第一级交换机之间链路的可靠性难题 [12] - 在巨头看来,互联技术首先要可靠可控、可预测、可诊断、可维护,这往往比追求极限性能更重要 [12] - Lumentum的ZeroFlap光学解决方案通过重新设计DSP实现带内通信和实时遥测,能识别潜在风险并主动干预,但其系统级能力目前仍主要用于基于激光的光模块,短距互联的可靠性上限依然掌握在铜缆/有源电缆组件手中 [13] 过渡方案持续蚕食CPO的叙事空间 - 线性驱动可插拔光模块、有源电缆组件、有源光缆等过渡方案正在分流原本被寄望于CPO的应用空间 [14] - Arista称800G速率的LPO光模块已实现大规模部署,由于无需数字信号处理器,为客户带来了更低的资本支出和功耗,运营支出也相应减少,并有信心在1.6T速率下实现LPO稳定运行 [15] - 有源电缆组件与有源光缆的逻辑是在2–30米的关键互联区间,提供接近铜缆的可靠性与接近光学的带宽 [15] - Credo强调其在有源电缆组件市场开创了先河,并拥有端到端掌控能力构成的竞争壁垒 [16] - Marvell的“黄金线缆计划”提供完整的参考设计,使其DSP能适配各类线缆,满足客户多源供应的需求 [17] - Credo指出,其在有源光缆中投入的微LED技术可直接应用于近封装光学,其功耗仅为CPO的1/3,且无需复杂交换机设计,当行业需要CPO替代方案时该路径更具优势 [17][25] CPO面临多重工程与商业挑战 - **可维护性突出**:CPO技术核心目标是降低成本和功耗,但行业仍在解决可维护性问题;博通指出CPO三大缺陷:成本更贵、基于激光的可靠性远不如现有技术、功耗并非最低 [18] - **系统设计复杂**:纵向扩展所需光互联是一种完全不同的技术类型,必须直接与千瓦级XPU和交换机共封装;光链路中连接器是关键组件,负责将光子集成电路的光输出耦合到光纤,目前限制了光学技术的规模化 [18] - **成本结构不确定**:CPO不是便宜的光模块,而是昂贵的系统工程,散热、供电、测试、维修全部需要重构 [18] - **生态尚未形成**:需要交换机、光学、封装、软件协同成熟,而客户机会成本高,没有时间去认证新的供应商,生态建立需要多年时间 [19] 超大规模云厂商态度谨慎的深层原因 - **可靠性要求极高**:超大规模客户使用的AI系统包含大量组件,Credo认为以系统形式销售并对整个系统承担全部责任是合理的,而CPO一旦出现问题则是“整板级风险” [22] - **运维体系惯性巨大**:所有超大规模云厂商都拥有自己的网络团队和已建立的完善流程;客户的认证周期很长,且当前最关注的首要因素是上市时间 [22] - **供应链安全优先**:博通建设新加坡工厂内部化先进封装产能,旨在保障供应链安全和交付稳定性,而CPO技术的供应链成熟度远低于可插拔光模块 [22] - **架构灵活性需求强烈**:在行业标准尚未最终确定时,客户不愿冒险将所有赌注押在某一种协议上,而可插拔架构提供了灵活性 [23] 行业技术路线与时间表预判 - CPO是互联体系的“最后一公里”技术,是终极解法之一,但非当前阶段最优解,其应用场景将收敛于极高端口密度、极端功耗约束等特定系统 [24] - 在相当长一段时间内,线性驱动可插拔光模块、有源电缆组件、有源光缆以及ZR光模块仍将承担数据中心互联主力角色 [24] - Arista明确表示线性驱动可插拔光模块的演进远未结束,有信心在1.6T速率下实现其稳定运行 [25] - **时间节点判断逐步收敛**: - 2027年:CPO进入小规模测试与验证阶段 [31] - 2028年及以后:CPO在特定场景(主要是纵向扩展的高密度系统)中开始规模化部署 [26] - Lumentum预测到2027–2028年左右,首批采用CPO的客户中约有40%–50%的交换机将基于CPO技术,但存在较大不确定性 [26] - Astera Labs预计将在2028–2029年实现大规模部署,2027年更多是测试性部署 [26] - 行业真正需要的不是技术可行性证明,而是系统必要性证明,只有当现有过渡方案路径在功耗、密度、可靠性上同时触顶,CPO才会从未来选项转变为当下必需 [27]
互联技术扛起大旗,国产化闭环近了?
半导体行业观察· 2025-09-26 09:11
文章核心观点 - 国产AI算力产业链正通过技术创新和生态合作实现闭环 重点突破互联技术瓶颈 推动算力自主化进程 [1][6][18] 行业政策与战略方向 - 国务院印发《关于深入实施"人工智能+"行动的意见》 明确要求强化8项基础支撑能力 包括提升模型基础能力 加强数据供给创新 强化智能算力统筹等 [6] - 工信部联合多部门发文 强调以新一代通信技术驱动 构建覆盖感知 传输 存储与计算的基础设施体系 并合理布局区域枢纽节点 逐步提高智能算力占比 [6] - 上海智能算力产业已形成基础夯实 创新活跃 场景丰富的良好态势 需强化技术创新协同 完善算力调度体系 深化场景融合应用 [3] 互联技术价值与突破 - 互联技术成为AI基础设施关键环节 高带宽低时延互联能力是提升模型性能 降低成本 实现普惠AI的重要路径 [6] - 英伟达NVLink 5.0为每个Blackwell GPU提供1.8TB/s双向带宽 NVSwitch芯片在GB200 NVL72系统中构建总带宽130TB/s的72 GPU NVLink域 [7] - 奇异摩尔提供覆盖Scale-out网间互联 Scale-up超节点GPU片间互联 Scale-inside芯片内互联的全栈互联解决方案 [8] - 奇异摩尔Kiwi G2G IO Die超节点互联芯粒支持TB级带宽 Kiwi SNIC AI原生超级网卡支持800Gbps传输带宽 μs级延时 [10] - 奇异摩尔片内互联方案基于UCIe的D2D IP及Central IO Die系列 可提升AI网络单卡算力 [12] 生态合作与标准建设 - 中国移动联合产业链企业启动智算开放互联OISA生态共建 发布OISA 2.0协议 支持1024张AI芯片 TB/s级带宽 数百纳秒时延 [14] - OISA协议打破Scale-up协议带宽与延迟瓶颈 明确OISA IP OISA IO芯粒等互联承载物设计方向 [15] - 沐曦形成完整产品线 涵盖芯片 板卡 服务器及多形态超节点 创新推出光互连超节点 耀龙3D Mesh超节点等 [17] - 新华三H3C UniPoD系列超节点支持以太网和PCIe双协议 实现单机柜最高64卡GPU高速互联 [17] 产业链协同与发展趋势 - AI算力需求从单体智能向群体智能发展 互联技术成为延续摩尔定律 提升算力密度的核心路径 [18] - 国内先进工艺受限背景下 互联技术可通过规模和成本换性能 实现算力自立 [18] - 产业链需上下游协同突破超节点互联协议性能瓶颈 打造媲美国际先进水平的产品 [17]
博世智能驾控中国区产业创新项目落地苏州未来将向全球市场输出智驾技术成果
新华日报· 2025-08-28 07:07
博世在华投资与战略升级 - 博世计划未来5年在苏州工业园区投资100亿元人民币 开展智能辅助驾驶与智能座舱领域深度合作[1] - 该项目将首次实现智驾领域领先技术由中国主导研发 并向全球市场输出技术成果[1] - 博世苏州是公司在华最大研发制造中心之一 涵盖6个事业部 员工超9000人 曾获全球灯塔工厂及中国质量奖[1] 博世技术优势与产业基础 - 博世在智能辅助驾驶领域部署行业领先的一段式端到端算法[1] - 智能座舱领域拥有超百个量产或研发项目 累计出货量突破250万套[1] - 公司自1999年进入苏州以来 历经从生产向研发(2005年)、制造向智能制造(2014年)的转型升级[2] 合作历程与里程碑事件 - 2018年博世苏州新研发中心启用 成为博世全球最大研发基地之一[2] - 2023年博世新能源汽车核心部件及自动驾驶研发制造基地在园区奠基[2] - 本次签约被视作双方合作历程中的又一里程碑[2] 中国市场战略重要性 - 博世认为中国在软件、人工智能及互联技术驱动的产业转型速度全球最快[3] - 公司强调要在中国保持领先才能维持全球领先地位[3] - 博世将坚定在中国及苏州的持续投入和发展[3]