Workflow
TPU v7p*
icon
搜索文档
全球主流算力芯片参数汇总、整理、对比
是说芯语· 2025-06-20 21:38
芯片厂商及产品 - 英伟达、英特尔、AMD及美国互联网大厂是主要芯片厂商 [1] - 国产芯片厂商包括寒武纪、昆仑芯、燧原科技、摩尔线程、沐曦科技、壁仞科技、天数智芯等 [3] 芯片制程及性能 - 英伟达B200采用4NP制程 晶体管数量2080亿 芯片面积1600mm² 晶体管密度130万/mm² [5] - 英伟达H100-SXM采用4nm制程 晶体管数量800亿 芯片面积814mm² 晶体管密度98万/mm² [5] - AMD MI300X采用5nm制程 晶体管数量1530亿 芯片面积1017mm² 晶体管密度15万/mm² [5] - 谷歌TPU v7p采用3nm制程 晶体管数量2744亿 芯片面积890mm² 晶体管密度308万/mm² [5] - 寒武纪MLU370-X4采用7nm制程 晶体管数量390亿 [5] 芯片能效比及算力 - 英伟达GB200 BF16算力5000 TFLOPS INT8算力10000 TFLOPS FP4算力20000 TFLOPS [7] - 英伟达B100 BF16算力30 TFLOPS INT8算力60 TFLOPS FP16算力900 TFLOPS [7] - AMD MI300X BF16算力490 TFLOPS FP16算力980 TFLOPS FP32算力1961 TFLOPS [7] - 谷歌TPU v7p BF16算力4614 TFLOPS FP16算力4614 TFLOPS FP32算力2307 TFLOPS [7] - 寒武纪MLU370-X4 BF16算力150 TFLOPS INT8算力256 TFLOPS [7] 显存技术及带宽 - 英伟达B200采用HBM3e显存 显存带宽16TB/s 显存容量384GB [8] - 英伟达H100-SXM采用HBM3显存 显存带宽3.35TB/s 显存容量80GB [8] - AMD MI300X采用HBM3显存 显存带宽5.3TB/s 显存容量192GB [8] - 谷歌TPU v7p采用HBM3e显存 显存带宽7.3TB/s 显存容量192GB [8] - 寒武纪MLU370-X4采用LPDDR5显存 显存带宽0.3TB/s 显存容量24GB [8] 国产芯片进展 - 寒武纪MLU370-X4于2022年发布 采用7nm制程 晶体管数量390亿 [5] - 昆仑芯R200于2021年发布 采用7nm制程 芯片面积504mm² [5] - 燧原科技邃思1.0于2019年发布 晶体管数量141亿 芯片面积480mm² [5] - 壁仞科技BR100于2022年发布 晶体管数量770亿 芯片面积1074mm² [5] - 天数智芯天垓100于2021年发布 晶体管数量240亿 [5]
全球算力芯片参数汇总
是说芯语· 2025-05-07 14:05
半导体综研 . 半导体供应链数据研究综合平台 以下文章来源于半导体综研 ,作者关牮 JamesG 申请入围"中国IC独角兽" 半导体高质量发展创新成果征集 前言: AI 大模型能力的快速提升(如 Qwen3 、 Llama4 的多模态升级与逻辑推理优化)正推动 AI 从辅助工 具向核心生产力渗透。而算力芯片的性能对大模型的训练、推理至关重要。本文通过统计全球主要算力 芯片的 算力、显存 和 互联带宽 指标,对比海外第三方设计公司、海外大厂自研和国产芯片的单卡性 能。 不考虑软件(如 CUDA )、 Scale out 架构(如华为 CloudMatrix 超节点)和成本。 一、算力指标 1. 制程: 海外: 第三方设计公司:为后续产品制程的升级预留了空间。 英伟达最新的 Blackwell 系列使用了 TSMC 4NP ,相当于 4nm 高性能版本。 AMD 、英特尔最新产品的制程都是 5nm 。 Groq 为了追求性价比, 使用 GlobalFoundries 的 14nm 。 大厂自研: 谷歌最新的 TPU Ironwood ( TPU v7p )和亚马逊的 Trainium3 都使用了最先进的 3nm ...