Workflow
聊一聊AI ASIC芯片
傅里叶的猫·2025-09-29 00:00

文章核心观点 - AI ASIC作为专用芯片,在AI推理时代凭借高能效、低成本和软硬件协同优势,成为大厂应对算力需求爆发和降低TCO的关键路径 [2][4][5][6] - AI推理需求随模型能力提升和Token消耗快速增长而爆发,推动AI ASIC市场进入高速增长期,AMD预计2028年全球市场规模达1250亿美元 [9][10][11] - 海外云服务厂商自研AI ASIC已形成成熟模式,以谷歌TPU为代表,通过与博通等设计服务商合作实现快速迭代和商业化 [16][17][20][21] - 国内AI云市场集中度提升推动头部云厂商自研AI ASIC需求,百度、阿里等公司产品已进入规模化应用阶段,国产ASIC产业链迎来战略机遇 [24][25][26][27][28] ASIC与GPU技术对比 - ASIC与GPU架构相似但定位不同:ASIC为特定场景定制,采用脉动阵列等架构优化矩阵运算,实现高能效和低功耗;GPU需兼顾图形渲染等通用场景,基于冯诺依曼架构存在存储瓶颈 [4] - 谷歌TPU v5能效比为英伟达H200的1.46倍,在BERT推理中每瓦性能提升3.2倍;亚马逊Trainium2训练成本降40%,推理降55%,10万卡集群可节省12亿美元初始投资 [4] - ASIC优势源于3D堆叠优化算力密度、DVFS降低闲置功耗、HBM3e内存突破带宽瓶颈(达1.2TB/s) [4] 大厂自研ASIC动因 - 核心驱动力为降低TCO:自研可规避外采芯片的厂商利润,英伟达FY2025毛利率75.5%、净利率57%,数据中心芯片利润约582亿美元 [6][8] - 应对内部AI需求爆发,实现软硬件协同优化,如谷歌TPU整合TensorFlow实现极致性能 [5] - 减少外部依赖,保障供应链安全 [5] - 自研投入包括设计团队收购(如亚马逊3.5亿美元收购Annapurna Labs)、外部服务商NRE费用及IP采购,规模起量后单颗芯片研发成本显著摊薄,谷歌2023年TPU超200万颗,年研发20亿美元,单颗摊薄1000美元 [7][8] AI推理需求增长 - 推理收入模型为(价格/token)×(吞吐量, tokens/秒),硬件性能直接决定token生成速度,低成本高效的AI ASIC在推理场景优势显著 [9] - ChatGPT C端周活跃用户截至2025年7月达7亿,占全球成年人10%,OpenRouter统计显示API Token日消耗量从2024年9月不足0.5T升至2025年8月近5T,一年内翻近10倍 [10] - OpenAI于2025年9月成为博通定制AI ASIC第四位客户,订单近百亿美元 [10] AI ASIC产业链环节 - 产业链分为前端(需求定义、架构设计)和后端(设计实现),云厂商多与设计服务商合作,定制芯片包括计算、存储、网络IO和封装四部分IP [13] - 国际设计服务商以博通、Marvell为主导,提供完整IP解决方案;国内主要参与者包括芯原股份、翱捷科技、灿芯股份 [14][16][28] - 关键IP包括处理器IP(如CPU/GPU)、接口IP(如SerDes)、内存IP(如HBM),SerDes技术直接影响Die-to-Die及芯片间通信效率,是AI算力关键瓶颈 [14][33] 海外云厂商自研案例 - 谷歌TPU迭代至第七代Ironwood,支持主动检索和协作推理,提供4614 TFLOPS FP8算力、192GB HBM3e内存、7.3TB/s带宽,SuperPod支持9216颗芯片互联 [18][20] - 博通作为核心服务商,2024年AI ASIC收入122亿美元,2025前三季137亿美元,其优势包括完整IP体系(21000专利)、多代TPU设计经验、3.5D SOIC封装技术、高速互连与CPO技术 [21][23] - 谷歌TPU成功源于架构创新(脉动阵列)、系统级思维(TPU Pod集群)、与博通合作降低风险和成本 [20] 国内ASIC发展现状 - 2025年上半年中国企业级大模型日均总Token消耗达10.2万亿,环比增长363%;中国AI云市场2025年规模预计518亿元,2025-2030年CAGR 26.8% [24] - 市场格局集中,CR5超75%,头部云厂商阿里云(占比35.8%)、火山引擎(14.8%)、华为云(13.1%)等均布局自研AI ASIC [24] - 百度昆仑芯第三代P800已部署万卡集群,中标中国移动10亿元集采大单;阿里平头哥PPU关键指标超英伟达A800,签获16384张卡订单;字节自研训练+推理芯片预计2026年前量产 [25][26] 国内ASIC服务商分析 - 芯原股份为国内第一设计IP厂商,拥有6类处理器IP及1600+数模混合IP,5nm系统级芯片一次成功,未来增长点来自AI ASIC、AIGC芯片等 [29][31] - 翱捷科技第一大股东为阿里巴巴,2025上半年芯片定制及IP授权服务收入约1.44亿元,通过创新架构为系统厂商提供合规ASIC [29][32] - 灿芯股份第一大股东为中芯国际,主打28nm及以上成熟制程,优化高速接口IP以适配AI推理场景 [29][32]