GPGPU架构

搜索文档
怎么看华为超节点和国产卡26年的竞争格局
2025-08-05 11:20
行业与公司 - 行业涉及国产AI芯片、算力卡市场及GPGPU架构发展[1][3][7] - 主要公司包括华为、海光、寒武纪、摩尔、沐曦、燧原、昆仑芯等[1][4][10] 核心观点与论据 **华为384超节点的优势与定位** - 采用光模块互联技术,速度显著提升,推理场景性价比高且落地确定性高[1][2] - 支持SP8格式,性能优于未配备SP8的国产卡,兼具训练能力[2][9] - 通过铜线连接和光模块实现高速传输,应对英伟达Nvlink瓶颈[8][9] **国产AI芯片技术进步与竞争格局** - 摩尔S5,000支持SP8和互联,沐曦C600支持FP8并采用先进工艺,性能接近国际水平[4] - 华为升腾转向GPGPU架构降低互联风险,燧原增加核心数量并向GPU靠拢[7] - 2026年新一代产品将提升性能,竞争格局复杂化但整体稳定[1][4][10] **超级点方案的应用** - 海光静默式液冷方案支持660张卡,总功耗750千瓦,突破单服务器限制[5][6] - 华为384超节点和海光700张卡集群成为推理市场重要形式[9][12] **市场需求与采购趋势** - 推理需求增长(多模态时代推动),国产算力卡占比提升[3][10][12] - 大型互联网公司(如字节跳动、阿里、腾讯)测试国产卡,需求集中在SP8、互联和产能[4][10] - 长尾客户(运营商、金融、央企等)需求旺盛,中国市场供不应求[3][16] 其他重要内容 **GPGPU架构发展趋势** - 国内厂商技术方案融合,华为升腾转向GPGPU,燧原缩小核心尺寸[7] - 2026年估值修复预期(寒武纪、海光),英伟达2023年估值中枢45倍,2024年40倍[7] **市场数据与收入** - 可灵2025年AI应用收入预计2亿美元(约15亿人民币),其他公司达数千万至数亿[10] - 国产算力卡2026年估值受关注,预计快速增长[13] **展会动态** - 摩尔、燧原等新产品支持互联和FP8,送测互联网公司或供货非互联网客户[14] **中美需求差异** - 美国需求集中于头部客户(90%),中国长尾客户(运营商、金融等)占比高[16]
聊聊910D和920
傅里叶的猫· 2025-06-14 21:11
AI半导体产品更新 - 910D已确定为四个Die的设计 与910C相比由两个Die升级为四个Die 增加了FP8配置并提升Switch规格 生态层面有所优化但其他配置提升不明显 [1] - 910D单卡综合性能预计超过H100 可支持部分训练型应用 但超过400亿参数的模型性价比会明显下降 [1] - 910D首批回片预计下月中旬 量产出货最乐观为2025年第二季度 最晚延迟至2026年第二季度末 [1] 新一代GPU架构进展 - 920首个版本采用双Die设计并优化工艺 架构全面转向GPGPU 生态将与NVIDIA互通 [1] - 920回片时间预计2025年底 量产出货时间为2027年年中或六七月份 [1] 行业服务动态 - 公司与国内数据中心厂商合作提供GPU租赁服务 [2] - 知识星球平台每日更新外资投行科技研报 包含SemiAnalysis等机构完整报告及Seeking Alpha等精选内容 [3] - 平台推送精选国内外券商研报 当前优惠价390元 [4]