行业与公司 * 行业为AI数据中心基础设施 特别是大中华区科技硬件领域[1][3] * 核心事件是2025年OCP全球峰会 主题为“扩大规模” 专注于未来几年高效能大规模AI数据中心基础设施的建设和加速[1][3] * 峰会参展公司数量从去年的99家增加至129家 其中台湾公司从22家增加至27家[3] 核心观点与论据 1 扩大基础设施规模与集群 * Meta指出其GPU集群已从128个GPU扩展到去年12万9千个GPU的区域规模集群 并计划部署“大规模且多种多样的集群”来支持其雄心[8] * Meta认为当前计算容量不足 其Richland & Parish站点是一个5GW数据中心 未来几年将建设更多类似设施 整个行业也将如此[8] * 因此 快速制造和提升计算容量的能力将至关重要[8] 2 硬件多样性与标准化 * Meta认为其数据中心将继续采用混合多样的硬件组合 原因包括公司规模庞大需要供应链的弹性和多样性 以及为特定工作负载寻找最佳硬件[9] * 这导致在多个硬件平台上扩展会带来显著复杂性 因此Meta持续为OCP做出贡献以推动进一步标准化 从而减少复杂性 使供应链能够更快地制造这些超级计算机[9] 3 更大机架与规模扩展域 * AMD Helios机架采用开放式宽机架规格 宽度是ORv3机架的两倍 达到21英寸 旨在实现更大的规模扩展域[7][10] * 行业正在构建计算能力高度集中的芯片 需要将这些芯片置于低延迟环境中 因此需要更大的机架[10] * 当前设计必须保持在铜线连接 这推动了更大机架的需求 但构建更大机架面临设计制造复杂性高 运输成本高且重 以及可维护性操作更困难等挑战[10] * Meta提到其ODM和合同制造合作伙伴需要为每交付10MW的数据中心容量 额外建设1MW的测试容量[10] 4 未来向解耦架构发展 * Meta相信未来必须是解耦的 尽管短期内机架功率密度将继续增加 但最终会下降 因为行业将能够使用光学技术实现解耦[11] * 当前行业受限于铜线在规模扩展域中的极限 但希望依赖光学技术 从而在数据大厅的更大表面积内实现更大的规模扩展域[11] 5 关键产品发布与时间表 * AMD Helios机架预计于2026年下半年开始出货 关键客户可能包括Meta、Oracle和OpenAI等[7][12] * 800 VDC电源架构正在开发中 目标是与Rubin Ultra平台在2027年下半年首次亮相[7] * 谷歌Deschutes 2MW CDU和ESUN网络是今年OCP的其他主要发布[1][7] 6 冷却技术趋势 * GB300计算托盘目前大规模生产的是混合冷却解决方案 85%液体加15%空气 每个计算托盘只有6套快速接头[14] * 下一代VR200计算托盘预计将采用全液冷 意味着将有14套快速接头[14] * 根据Promersion的观点 浸没式冷却可能在2028年出现拐点 但冷板技术仍将是市场主流[22] 7 网络优化倡议 * 以太坊规模扩展网络由AMD、ARM、Arista、博通、思科、HPE网络、Marvell、Meta、微软、英伟达、OpenAI和Oracle等公司引入 旨在利用成熟的以太网协议构建高速、低延迟的AI计算规模扩展网络结构[23] * 在硬件方面 Accton和Celestica展示了基于博通Tomahawk 6 ASIC的最新1.6T网络交换机产品[24] * Meta公布了其共封装光学器件研究的最新结果 显示其可靠性与可插拔配置相比更具优势 但可服务性和成本仍是未来广泛采用的关键因素[24] 其他重要内容 1 受益公司 * AMD Helios机架的推出 主要受益的亚太区公司是纬创和纬颖[7] * 800 VDC电源解决方案的主要受益公司是台达电和贸联[7] * 网络升级的主要受益公司是智邦[7] * 支持AMD Helios机架的更强机械部件 对勤诚和金像电子等供应商是积极的[13] * 随着AI服务器集群功耗增加 电源互连规格将继续升级和美元含量增长 对贸联等供应商是积极的动态[20] 2 供应链与生产信息 * 基于供应链核查 Sanmina应该是AMD的新产品导入伙伴 但纬颖应该是Meta的主要ODM伙伴[12] * 在组件层面 纬创是GPU模块、基板和交换机托盘的主要ODM伙伴 大多数PCB将需要M9级CCL[12] * GB300良率不再是问题 生产顺利 VR200的初始机架级生产和测试目前正在进行中 预计机架交付在2026年第三季度末[14][15] * 对于仁宝和神达等ODM/OEM厂商 其在GB200/300或英伟达HGX系统方面的曝光度有限[16][18] 3 技术规格与效益 * 800 VDC解决方案允许通过相同的铜线传输超过150%的电力 无需额外的200公斤铜排为单个服务器机架供电 与传统数据中心的50V电源架构相比 可将电源使用效率提高约5%[19] * 谷歌Deschutes CDU的特点是3摄氏度的接近温差 以及80 PSI的可用压力 以实现大型AI加速器的先进冷板设计[21]
中国科技-2025 年 OCP 全球峰会 -规模化是核心焦点-Greater China Technology Hardware-2025 OCP Global Summit – Scale Up the Key Focus
2025-10-21 09:52