报告行业投资评级 - 看好 [2] 报告核心观点 - ASIC专用芯片在AI大模型推理阶段具备显著成本效益优势,能效比和单位算力成本表现突出,验证了其商业化拐点 [3] - AI渗透率提升推动推理需求激增,Token消耗量近一年翻近10倍,驱动ASIC市场空间扩大,预计2028年全球AI ASIC市场规模达1250亿美元 [3][31][32] - ASIC设计服务商在产业链中价值凸显,博通等头部服务商凭借完整IP体系、先进封装技术和量产经验获得持续订单,国内厂商如芯原股份、翱捷科技、灿芯股份迎来发展机遇 [3][60][89][90] - 国产ASIC发展呈现PD分离和超节点两大趋势,华为昇腾950分型号适配不同场景,海光、华为构建开放互联生态,区别于海外封闭路径 [3][99][107][115] 大模型推理带动ASIC需求 - ASIC与GPU技术边界趋同,但商业模式差异显著:ASIC为下游场景高度耦合的专用芯片,GPU需覆盖多场景属通用芯片 [3][14][15] - ASIC能效比优势突出,谷歌TPU v5能效比为英伟达H200的1.46倍,亚马逊Trainium2训练成本较GPU方案降低40%,推理成本降55% [3][18] - 自研ASIC可显著降低TCO,外采芯片需承担厂商利润,英伟达FY2025净利率达57%,其数据中心AI芯片收入1022亿美元 [3][21] - 推理需求激增驱动ASIC放量,ChatGPT C端WAU达7亿,OpenRouter统计Token消耗量从2024年9月不足0.5T提升至2025年8月接近5T [3][25][31] ASIC设计复杂度高,服务商价值凸显 - 谷歌TPU成功离不开与博通合作,博通核心优势包括30亿美元投入积累的完整IP体系、TPU设计经验、3.5D XDSiP封装技术及高速互联能力 [3][59][60][69] - 博通2024年AI ASIC收入122亿美元,2025年前三季度达137亿美元,季度环比增速超越英伟达 [3][60] - 芯片设计连贯性带来高客户转换成本,服务商壁垒稳固,头部云厂如谷歌、亚马逊、Meta、微软均依赖博通、Marvell等专业服务商 [3][44][60][75] - 国内设计服务商各具优势:芯原股份具备5nm工艺能力和丰富IP积累,翱捷科技在手订单充足,灿芯股份依托中芯国际布局成熟制程 [3][89][90][91] 国内ASIC发展机遇 - 2025H1中国AI云市场CR5超75%,头部云厂自研ASIC成果显著:百度昆仑芯实现万卡集群部署并中标10亿元中国移动订单,阿里平头哥PPU显存带宽超英伟达A800并签约16384张算力卡订单,字节计划2026年前量产自研芯片 [3][78][83][84][87] - 国产ASIC服务商覆盖不同技术需求,芯原股份2024年芯片量产收入8.6亿元、芯片设计7.2亿元、IP授权7.4亿元,灿芯股份芯片量产收入8.1亿元 [3][91] - SerDes等关键IP国产化加速,国内厂商如芯潮流、晟联科、集益威已布局56Gbps-112Gbps产品,但224Gbps仍依赖海外 [3][95] 国产ASIC技术趋势:PD分离与超节点 - PD分离成为推理场景主流趋势,Prefill任务计算密集型,Decode任务内存带宽受限,华为昇腾950分PR和DT型号适配不同场景 [3][97][99][107] - 英伟达Rubin CPX专为Prefill优化,采用GDDR7替代HBM降低成本,预计2026年底上市 [3][99][103] - 超节点通过高带宽互联整合多处理器,国内海光开放HSL协议吸引寒武纪等参与,华为开放灵衢总线支持超8192卡扩展,均采用开源开放模式 [3][109][115][117] - 华为昇腾950PR采用自研低成本HiBL 1.0 HBM,950DT采用HiZQ 2.0 HBM,内存带宽达4TB/s,互联带宽2TB/s [3][107]
ASIC系列研究之四:国产ASIC:PD分离和超节点