Ascend 10C

搜索文档
SemiAnalysis-华为 AI CloudMatrix 384:中国对标英伟达 GB200 NVL72 的答案
2025-08-15 09:24
**行业与公司** - 行业:人工智能(AI)加速器、高性能计算(HPC)、半导体制造 - 公司:华为(Huawei)、Nvidia、SMIC(中芯国际)、三星(Samsung)、TSMC(台积电) --- **核心观点与论据** **1 华为CloudMatrix 8的性能与架构** - **对标产品**:华为CloudMatrix 8(CM8)基于Ascend 10C芯片,直接对标Nvidia GB200 NVL72,部分指标超越Nvidia[3][4] - **系统级优势**:CM8在系统层面(加速器、网络、光学、软件)创新,而非仅芯片层面[4] - **关键指标**: - **计算性能**:CM8提供300 PFLOPS(BF16密集计算),比NVL72(180 PFLOPS)高1.7倍[10] - **内存带宽**:CM8为1,229 TB/s,是NVL72(576 TB/s)的2.1倍[10] - **功耗**:CM8全系统功耗559,378W,是NVL72(145,000W)的3.9倍,但中国无电力限制[10][12] **2 华为的供应链与制裁规避** - **芯片制造依赖**:Ascend 10C主要依赖TSMC 7nm工艺,而非SMIC[7][17] - **HBM来源**:三星是华为HBM主要供应商,通过第三方(如CoAsia Electronics)规避出口禁令[19][20] - **制裁规避手段**: - 通过Sophgo采购TSMC晶圆(价值5亿美元)[17] - 利用Faraday Technology“包装”HBM芯片,再拆解提取[21] **3 中国半导体产业的潜力与挑战** - **国内产能**:SMIC计划扩产至50,000片/月(7nm),但良率(5%-50%)和供应链(光刻胶、设备)仍是瓶颈[25][27] - **电力优势**:中国电力供应充足(煤炭、核能、可再生能源),支持高功耗AI基础设施[13][14] - **长期风险**:美国可能加强制裁,限制HBM、晶圆制造设备等关键领域[7][24] **4 CM8的架构细节与成本** - **网络设计**: - **Scale-Up**:采用全光学互联(5,760个400G LPO光模块),功耗和成本高于Nvidia铜互联[37][38] - **Scale-Out**:两层级拓扑,使用1,536个光模块[43] - **成本对比**: - CM8每GPU互联成本4,672美元(Nvidia为4,075美元),功耗159W/GPU(Nvidia为75W/GPU)[39] **5 华为与Nvidia的芯片级对比** - **Ascend 10C芯片**: - 性能为Nvidia B200的30%(780 TFLOPS vs 2,500 TFLOPS)[10] - 内存带宽3.2 TB/s(B200为8 TB/s)[10] - **系统级优势**:通过数量(384 GPU vs 72 GPU)和光学互联弥补单芯片劣势[10][47] --- **其他重要内容** - **光学技术**:华为采用线性可插拔光学(LPO)模块,降低功耗30%,但总量仍导致高功耗[44][45] - **地缘政治影响**:美国需关注中国通过第三方规避制裁的行为,尤其是HBM和晶圆制造设备[7][20] - **行业趋势**:AI基础设施竞争从芯片转向系统架构,电力供应成为关键差异化因素[5][15] --- **数据引用** - CM8全系统功耗:559,378W [10] - NVL72全系统功耗:145,000W [10] - SMIC晶圆产能:50,000片/月(7nm)[25] - HBM库存:100万颗(支持105万颗Ascend 10C)[19]