TPU v7

搜索文档
GPU跟ASIC的训练和推理成本对比
傅里叶的猫· 2025-07-10 23:10
芯片供应商及产品规划 - NVIDIA全球市场AI GPU产品线从A100到GB100覆盖2020至2027年,制程从7nm演进至3nm,HBM容量从80GB提升至1024GB [2] - NVIDIA中国市场特供版包括A800/H800/H20等型号,HBM容量最高96GB,部分型号采用GDDR6显存 [2] - AMD MI系列从MI100到MI400规划至2026年,HBM3e容量达288GB,MI400将采用HBM4技术 [2] - Intel AI GPU产品包括MAX系列和Gaudi ASIC,Habana 2采用HBM3e技术容量达288GB [2] - Google TPU v5e至v6采用5nm/3nm制程,HBM3e容量最高384GB [2] - AWS Tranium系列采用Marvell/Alchip设计,Tranium3 Ultra将使用3nm制程和HBM3e [2] 大模型训练成本分析 - 训练Llama-3 400B模型时,TPU v7成本显著低于GPU,呈现断档式优势 [7] - NVIDIA GPU中GB200超级芯片训练成本最低,H100成本最高,验证"买得越多省得越多"规律 [7] - Trainimium2训练成本异常高企,与迭代预期不符 [7] - 硬件成本占比最高的是GPU部分,电力成本占比相对较低 [5][7] 推理成本比较 - AI ASIC在推理场景成本优势显著,比GB200低10倍 [10] - GPU产品中高端型号推理成本反而更高,与训练成本趋势相反 [11] - TPU v5p/v6和Tranium2在推理场景展现最佳性价比 [10][11] 技术参数对比 - GB200超级芯片峰值算力达5000 TFLOPS,是H100的5倍 [12] - HBM3e技术成为2024年主流,NVIDIA/AMD/Intel均采用该内存方案 [2] - 能效比方面GB200达2.25 TFLOPS/Watt,优于H100的1.41 TFLOPS/Watt [12] - MI300X与H100算力接近(981 vs 990 TFLOPS),但能效低7% [12] 供应链动态 - B200芯片已进入期货阶段,国内可接样品订单 [13] - 主要设计合作伙伴包括Broadcom、Marvell和Alchip等厂商 [2] - 行业信息显示3nm制程将在2025-2026年大规模应用于AI芯片 [2][12]
IP 设计服务展望:2026 年 ASIC 市场动态
2025-05-22 13:50
纪要涉及的行业和公司 - **行业**:IP/设计服务、ASIC市场 - **公司**:AWS、Google、META、Microsoft、Alchip、eMemory、GUC、Faraday、M31、Andes、Broadcom、Marvell、Apple、OpenAI、xAI、Intel、Bytedance、Li - auto、Furiosa、Qualcomm、MediaTek 纪要提到的核心观点和论据 各公司ASIC进展 - **AWS**:Trainium 3问题解决,继续与下游供应商接单,预计签署Trainium 4合同,实际项目已启动 [2] - **Google**:从TPU v6到v8进展稳定,规格高于其他CSP的ASIC,TPU v6p和v7p配置不同且ASP可能提升,未来难不与Broadcom合作 [2] - **META**:从MTIA v2向MTIA v3代际迁移,2026年MTIA v2产量10 - 20万片,MTIA v3产量20 - 30万片 [2] - **Microsoft**:Maia v2计划2026年量产50万片,原分配计划改变,Marvell获40万片;Maia v3供应商选择竞争激烈,预计年底出结果,MSFT/GUC团队分配量可能较少 [3][4] - **非CSP公司**:Apple、OpenAI、xAI等系统厂商构建自己的ASIC服务器,多在2H25流片,2H26量产,选择与Broadcom合作的规格高端,2027年非CSP服务器增多,利好Broadcom [7] - **Apple**:加速器预计4Q26量产,2026年出货10万片 [8] - **OpenAI**:3nm ASIC预计9月流片,2026年6月量产,2026年产量30 - 40万片,生命周期1 - 1.5年 [9] - **xAI**:3nm ASIC项目预计2H25流片,2H26量产,2026年产量30 - 40万片 [9] 公司业绩与业务情况 - **GUC**:FY25因Google CPU和加密项目收入可能超预期,Google 3nm服务器CPU收入提前至3Q25,预计成前5大客户;FY26即使无加密收入,代工收入仍有增长,CEO认为Google CPU和第三CSP客户潜在收入高于Maia v2 [10][11] - **M31**:今年重点是前季度签署合同的第二次付款;与Qualcomm合作紧密,Qualcomm 2H25启动2nm智能手机SoC项目,1Q26启动2nm AI PC处理器项目,MediaTek 2nm智能手机SoC项目未启动 [12][13] - **Faraday**:1Q25收入增长源于中国客户购买三星HBM2E的预付款,若客户被列入实体清单,剩余价值小且客户自行处理库存核销 [14] 其他重要但可能被忽略的内容 - 展示了多家公司的股票信息,包括市值、评级、价格、目标价、EPS、PE、PB、ROE、股息率等 [6] - 给出了CSPs的ASIC订单分配给设计服务提供商的情况 [15] - 呈现了ASIC的规格信息 [15] - 展示了ASIC MP的时间线 [17] - 给出了2026年各公司ASIC的芯片数量、晶圆发货量和收入贡献估算 [18]