Workflow
Cloud Matrix 384
icon
搜索文档
国产AI芯片超节点、产业链以及行业格局演变
2025-12-08 08:41
行业与公司 * **行业**:国产AI芯片行业[1] * **涉及公司**:寒武纪、随园、平头哥(阿里巴巴)、昆仑芯、沐曦、天树、华为、海光、中兴、天禄之星、木兮、摩尔等[1][2][3][4][5][6][9][12][13][14][15][19][22] * **下游客户/应用方**:字节跳动、腾讯、阿里巴巴、百度等互联网公司;政府智算中心;金融、运营商、能源等信创领域[1][2][5][7][8][10] 核心观点与论据 * **需求驱动**:英伟达高端产品(如H20系列)对华销售限制,促使国内互联网企业(字节跳动、腾讯、阿里巴巴)加速转向国产AI芯片,以满足大规模训练和国产化要求[1][5] * 字节跳动2025年90%-95%的寒武纪产能用于满足其需求[5] * 腾讯因投资随园而增加采购[5] * 阿里巴巴更多使用自家TPU和平头哥产品[5] * **性能对标**:国产AI芯片性能逐步提升,目前主要对标英伟达A100/A800系列,下一代产品预计达到H200系列60%-80%的性能水平[1][3] * 推理性能已基本与H20系列持平[1][3] * 新一代产品将采用HBM 3E或HBM 3,配备128GB或144GB HBM以保证带宽和容量[3] * **性价比优势**:国产芯片在单卡成本和总体拥有成本(TCO)方面更具竞争力[1][3] * **技术路径分化**: * **专有化GPU路线**(如寒武纪、华为):早期采用,性能目前处于前列(如华为910C、寒武纪690系列),但面临生态瓶颈[4][6][19] * **通用GPU路线**(如沐曦、天树):走CUDA兼容路线,在生态建设上更具优势,但需不断更新迭代以跟上最新扩展版本[4][6] * **超节点发展**:国内厂商加速追赶英伟达NV272/NVR 72方案,预计2026年底多家厂商将推出超节点解决方案[2][9] * **主要用途**:支持大规模模型训练,应对不断增大的参数规模[20] * **方案差异**:昆仑芯采用以太网交换机;寒武纪使用字节跳动自有协议;沐曦和天树依赖P3E等成熟方案;平头哥基于阿里方案并加入UALink联盟[1][9] * **市场趋势**:政府智算中心建设(除上海、合肥、杭州、深圳、北京五大核心区域外)放缓,芯片厂商更加注重行业落地应用和互联网需求[2][10] * 更强调智算中心的闭环管理和实际使用效果[2][11] * 信创领域(金融、运营商、能源等)因国产化需求,将优先部署国产化算力[7][8] * **供应链与产能挑战**: * **制程瓶颈**:大部分国产AI芯片集中在7纳米制程,更高制程(如5纳米)尚未普及,需通过多片互联提升单卡性能[1][4] * **功耗管理**:为弥补与英伟达的差距,风冷模组功耗需提升至800-1,000瓦,液冷模组功耗需提升至1,200-1,500瓦[1][4] * **先进制程分配**:新兴企业面临台积电、中芯国际先进制程产能有限的问题,需通过争取产能、双线生产等策略确保供应[16] * **竞争格局演变**: * **华为**:910C芯片(两个910B拼接)对标英伟达H100系列,目前具有一定优势[19] * **海光**:新一代BW1,000系列在腾讯测试中表现优异,领先其他玩家20%-30%,但因推出较晚,优势可能随时间减弱[15] * **昆仑芯**:主要客户为百度,2025年预计销售额达二三十亿元人民币,在国内市场仅次于华为[14] * **平头哥(阿里巴巴)**:性能相对较低(约100 TFLOPS),但兼容性好,在阿里内部采购占比逐渐增加,并直接面向安全与安防等行业客户[12] * **天禄之星**:天罡150系列与竞品存在约10%性能差距,但因其迭代至第二代,在产业应用及生态系统方面更完善,具有性价比优势[22] * **应对策略**:部分国内互联网大厂(阿里、腾讯、字节跳动)采用“PD分离架构”,即在海外(如东南亚)设立计算中心,使用H20、H100/H800等芯片训练模型,再将训练好的模型拿回国内进行微调和推理,以应对国内先进训练卡获取限制[2][16][17] * 若2026年超节点技术稳定性提高,可能逐步将更多训练任务迁回国内[17] 其他重要信息 * **出货预期**: * 预计2025年字节跳动卡数规模约为20万卡,2026年将翻倍至50万卡[2] * 整个市场超节点出货预期在50-80万卡之间[2] * **阿里巴巴采购情况**:内部采购来源多样,包括H20、H100、A100、A800以及寒武纪和华为产品,但平头哥占比逐渐增加[2][12] * 平头哥主要依赖台积电工艺,中芯国际产能有限且良品率较低[12] * 2025年上半年平头哥已供应几万颗芯片(具体数目不详)[18] * **互联网大厂库存**:腾讯、字节跳动、阿里巴巴等公司手中仍有大量英伟达芯片,以H20、A100/A800及H100为主,总体数量达几十万张卡[21] * 受工信部约谈影响,开始转向国产化测试[21] * **H200放开可能性**:尚不确定,若放开可能增加通用GPU赛道灵活性,使客户可混训,但也可能制约国产芯片厂商市场份额[14] * **交换机与网络**:中兴交换机在国内市场优势显著,支持400G以太网接口,与必认、天树等厂商合作密切,并自研网卡[13] * **下一代产品展望**:包括沐曦、寒武纪、华为等厂商将在2026年陆续发布新一代通用GPU,支持更高精度(如IP8)并提升互联带宽,预计将改变现有竞争格局[3][19]
人工智能月度跟踪:WAIC2025聚焦多种大模型、AI算力芯片和服务器-20250818
爱建证券· 2025-08-18 19:01
行业投资评级 - 电子行业评级为"强于大市" [1] 核心观点 - WAIC 2025聚焦大模型、AI算力芯片和服务器三大领域,展示国产AI技术突破 [5][6] - 国产AI产业链在大模型、算力芯片、服务器设备实现全面技术升级 [2] 国产大模型进展 - **阶跃星辰Step-3**:采用MoE架构,总参数量321B,激活参数量38B,在MMMU等榜单获开源最佳成绩,国产芯片推理效率达DeepSeek-R1的300% [11][12] - **商汤日日新V6.5**:多模态交互得分77.97,超越Gemini 2.5 Flash和GPT-4o,性价比较前代提升3倍 [19][21] - **腾讯混元3D世界模型**:开源下载量超230万次,支持文本/图像生成可编辑虚拟世界,7B端侧模型在AIME测试中优于同类 [25][28] - **阿里云Qwen3-Coder**:编程测试成绩接近ClaudeSonnet4,输入输出成本分别为$0.2/M和$0.8/M Tokens [33][39] 国产算力芯片突破 - **沐曦曦云C600**:实现国产GPU全供应链闭环,集成多精度算力与ECC安全模块,推出N/C/G三大系列覆盖智算、图形渲染等场景 [42][45] - **华为昇腾910C**:Atlas 900 A3 SuperPoD算力达300 PFLOPs,系统级BF16算力为英伟达GB200 NVL72的1.7倍,HBM容量达3.6倍 [48][51][53] 技术性能对比 - 华为昇腾910C在芯片封装层性能为英伟达GB200的0.3倍,但系统级HBM容量优势达3.6倍 [52] - 腾讯混元7B模型在AIME 2025测试中得分显著优于同类轻量化模型 [29] - 阿里云Qwen3-Coder在SWE-bench测试中达69.6%,接近ClaudeSonnet4的70.4% [35]