Workflow
Jericho4
icon
搜索文档
OCP亚太峰会要点 - 持续升级人工智能数据中心的路线图-APAC Technology Open Compute Project (OCP) APAC Summit Takeaways - A roadmap to continue upgrading the AI data center
2025-08-11 10:58
行业与公司概述 - **行业**:AI数据中心硬件、半导体、存储、网络及冷却技术[2][4][7] - **核心公司**: - **硬件/组件**:Accton、Delta、Lite-On - **半导体**:TSMC、AMD、ASE、Astera Labs、Broadcom - **存储**:Seagate - **超大规模云服务商**:Google、Meta、Microsoft - **电信**:NTT[2][7] 核心观点与论据 1. **AI数据中心技术路线图** - **Meta的Hyperion数据中心**:早期阶段,利好服务器ODM厂商(如Quanta、Wiwynn)及ASIC合作伙伴[4] - **AMD的UALink与Ultra Ethernet**: - UALink(低延迟扩展)比以太网快3-5倍(延迟210-260ns vs. 650ns-1.3ms)[11][12] - Ultra Ethernet(高吞吐扩展)支持超100万端点,效率优于传统RDMA[11][12] - **NVIDIA路线图**:Rubin GPU预计2026年Q3推出,功耗从B200的1,000W增至Rubin Ultra的3,600W(2027年)[4][23] 2. **电力与冷却创新** - **高电压直流(HVDC)**:从480V AC转向800V DC,减少铜用量,提升效率[23] - **液冷技术**: - 当前采用液对空冷却,2027年转向液对液[4] - Google的“Project Deschutes”CDU支持1.5MW冷却能力[24] - **固态变压器(SST)**:替代传统油冷变压器,依赖硅材料而非铜/铁[23] 3. **封装与光学技术** - **ASE的封装方案**: - FOCoS-Bridge解决内存带宽瓶颈,HBM堆栈从8个增至12-16个(2028年)[15] - 面板级扇出封装利用率达87%(传统300mm晶圆仅57%)[15] - **TSMC的CoWoS与CPO**: - CoWoS-L支持12个HBM3E/4堆栈(2025年),9.5倍光罩设计(2027年)[42] - CPO能耗从30pJ/bit降至<2pJ/bit[42] 4. **存储与网络** - **Seagate的HAMR硬盘**:容量从18TB(2024年)增至80TB+(2032年),NVMe协议替代SAS/SATA[41] - **Broadcom的以太网方案**: - Tomahawk Ultra(51.2Tbps)延迟<400ns,Tomahawk 6(102.4Tbps)支持128,000 GPU集群[19][22] 其他重要内容 - **边缘AI市场**:与数据中心架构不同,需低功耗集成(如MediaTek的SoC)[30] - **开放标准生态**:OCP推动硬件设计标准化,降低TCO(如Google开源Mt. Diablo电源架设计)[24][36] - **能源挑战**:AI服务器占全球数据中心电力需求增长的70%(2025-2030年)[34] 投资建议 - **推荐标的**: - **ODM厂商**:Quanta、Wiwynn、Hon Hai - **半导体**:TSMC(AI GPU代工主导)、ASE(封装)、MediaTek(边缘AI) - **电力/冷却**:Delta(HVDC市占领先)[5][21][28] 数据引用 - AMD预计2028年AI市场规模超5亿美元[11] - AI后端网络市场2028年或超300亿美元(650 Group数据)[18] - 全球数据量从72ZB(2020年)增至394ZB(2028年)[41] (注:部分文档如法律声明[44-108]未包含实质性行业/公司信息,已跳过)
Broadcom Ships Jericho4, Enabling Distributed AI Computing Across Data Centers
GlobeNewswire News Room· 2025-08-05 05:00
产品发布 - Broadcom宣布开始发货Jericho4以太网结构路由器,专为下一代分布式AI基础设施设计 [1] - Jericho4可互连超过100万个XPU,突破传统扩展限制,提供无与伦比的带宽、安全性和无损性能 [1] - 该产品与Tomahawk 6和Tomahawk Ultra共同构成完整的HPC和AI网络解决方案组合 [1] 技术规格 - Jericho4支持36,000个HyperPort,每个端口运行速度为3.2 Tb/s,具有深度缓冲和100公里以上的RoCE传输能力 [3] - 采用3.2T HyperPort技术,将四个800GE链路整合为单个逻辑端口,利用率提升高达70% [4] - 基于3nm工艺制造,配备200G PAM4 SerDes,无需额外组件如retimers,降低功耗和成本 [5] - 支持MACsec加密,在不影响性能的情况下保护数据中心间数据传输 [5] 行业应用 - 解决AI模型规模扩大带来的基础设施挑战,满足跨数据中心分布式XPU部署需求 [2] - 专为超高带宽、安全且无损的区域距离传输优化,突破单个数据中心的电力和物理限制 [2] - 符合Ultra Ethernet Consortium(UEC)规范,确保与UEC兼容的NIC、交换机和软件堆栈互操作 [6] 合作伙伴评价 - Accton计划利用Jericho4设计新平台,扩展AI网络,整合MACsec和200G SerDes等功能 [11] - Arista Networks认为该产品为其高性能R系列系统和EOS软件提供了完美补充 [12] - Arrcus表示Jericho4为分布式AI工作负载连接设定了新基准 [12] - DriveNets将利用Jericho4的深度缓冲和低延迟能力提供更大的AI网络可扩展性 [13] - Micas Networks指出该产品满足客户跨数据中心构建大规模AI结构的需求 [14] - Nexthop AI认为Jericho4支持从单机架到千兆瓦级AI集群的可扩展网络架构 [14] - Nokia表示Jericho4为其7250 IXR路由器提供高吞吐量、无损连接能力 [16] - UfiSpace认为该产品在性能、效率和客户选择之间取得了关键平衡 [16] 产品状态 - Jericho4目前已开始向客户提供样品 [8]
Broadcom Ships Jericho4, Enabling Distributed AI Computing Across Data Centers
Globenewswire· 2025-08-05 05:00
产品发布 - Broadcom宣布推出Jericho4以太网结构路由器,专为下一代分布式AI基础设施设计,可跨多个数据中心互连超过100万个XPU [1] - Jericho4突破传统扩展限制,提供无与伦比的带宽、安全性和无损性能,与Tomahawk 6和Tomahawk Ultra共同构成完整的HPC和AI网络产品组合 [1] - 单个Jericho4系统可扩展至36,000个HyperPort,每个端口运行速度为3.2 Tb/s,具有深度缓冲、线速MACsec和100公里以上的RoCE传输能力 [3] 技术特点 - Jericho4采用3.2T HyperPort技术,将四个800GE链路整合为单个逻辑端口,消除负载平衡低效问题,利用率提升高达70% [4] - 通过深度缓冲和智能拥塞控制,Jericho4确保100公里以上的无损RoCE传输,使分布式AI基础设施不受单一地点电力和空间限制 [4] - 采用3nm工艺制造,配备先进的200G PAM4 SerDes,无需额外组件如重定时器,降低功耗、成本和提升系统可靠性 [5] - 每个端口支持全速MACsec加密,保护数据中心间数据传输,在高流量负载下不牺牲性能 [5] 行业应用 - 随着AI模型规模和复杂性增长,基础设施需求超出单个数据中心的电力和物理限制,需要新型路由器支持跨区域高带宽、安全和无损传输 [2] - Jericho4完全符合超以太网联盟(UEC)规范,确保与广泛的UEC兼容NIC、交换机和软件堆栈生态系统无缝集成 [6] - 行业合作伙伴如Accton、Arista Networks、Arrcus等表示Jericho4将为分布式AI集群提供更高扩展性、性能和能效 [11][12][13][14][16] 产品生态 - Jericho4与Tomahawk系列产品共同构成完整的网络解决方案,支持从机架内到跨数据中心的分布式计算系统 [3] - 行业合作伙伴计划基于Jericho4设计新平台,整合MACsec、长距离200G SerDes和UEC等功能,满足扩展AI集群需求 [11] - 多家网络设备厂商表示Jericho4将用于构建从单机架到千兆瓦级AI集群的可扩展网络架构 [14][16] 产品状态 - Jericho4目前已开始向客户提供样品 [8]