国产GPU性能对比 - 壁仞科技2022年推出的BR100性能最强,但因制裁无法量产,华为昇腾910C成为实际国产最强[1] - 华为昇腾910C性能达到英伟达H800的60%,海光BW100深算能力约400T(H800的50%),寒武纪590性能为H800的30%-35%[1] - 性能排名:华为910C > 海光BW100C > 华为910B > 百度/阿里自研卡 > 寒武纪 > 沐曦/天数智芯等[2] 产品价格动态 - 海光BW100采购价约10万元/张,华为910B和910C分别为7万和18万元,寒武纪590价格从8万-8.5万降至6万-7万[2] 显存技术现状 - 国内GPU普遍采用HBM2e显存(受制裁无法使用HBM3e),推理任务中显存容量是关键门槛,主流产品显存容量均达64GB[3] - 华为910C显存带宽达3.2TB/s显著领先,壁仞BR100为2.3TB/s,沐曦蔵云C500为1.8TB/s,多数厂商产品在0.5-1.8TB/s区间[4][5] 算力参数细节 - 壁仞BR100的BF16算力达445T,FP16算力1024T为表格中最高,华为910C BF16算力244T,沐曦蔵云C500 FP16算力280T[5] - 昆仑芯RG800显存带宽0.2TB/s,平头哥含光800* FP16算力202T,燧原逐思2.0显存带宽1.8TB/s[5] 技术迭代趋势 - 海光BW100采用先进交换芯片设计,单卡可用性能实测达87%,优于寒武纪590(约80%),反映后发技术优势[2] - 寒武纪MLU370-X8显存容量48GB(带宽0.6TB/s),较早期MLU270-S4(16GB/DDR4)有明显升级[5]
国产GPU的性能PK