Workflow
N3晶圆
icon
搜索文档
AI 芯片大短缺 --- The Great AI Silicon Shortage
2026-03-16 10:05
行业与公司 * **行业**:半导体制造、AI加速器、数据中心、内存(DRAM/HBM)[1][5][12][65] * **公司**:台积电(TSMC)、英伟达(NVIDIA)、谷歌(Google)、AMD、亚马逊AWS(Amazon)、Meta、英特尔(Intel)、三星(Samsung)、SK海力士(SK Hynix)、美光(Micron)、博通(Broadcom)、Anthropic、苹果(Apple)、高通(Qualcomm)、联发科(MediaTek)、特斯拉(Tesla)[15][16][21][31][33][34][64][76] 核心观点与论据 * **AI算力需求激增,供应严重短缺**:Token需求飙升,模型能力提升和智能体工作流兴起推动用户采用和总需求增长,例如Anthropic仅在2024年2月就增加了60亿美元年度经常性收入(ARR)[5][7];按需GPU租赁价格持续上涨,即使是落后近两代的Hopper架构GPU[7];新兴云服务商(neocloud)的小型集群资源已全部被锁定[8];超大规模云厂商(hyperscaler)资本支出计划大幅上调,例如谷歌2026年资本支出预期较此前翻了一番[8][9] * **供应链瓶颈已转移至硅片(晶圆)供应**:尽管进行了大规模AI基础设施建设,但可用算力依然稀缺[5][7];当前主要制约因素从CoWoS封装、数据中心电力等转变为硅片供应短缺[12][13];先进逻辑芯片和内存制造产能不足以支撑计算部署速度[12] * **台积电N3(3纳米)工艺成为最大瓶颈之一**:N3系列于2023年开始贡献营收,最初需求由智能手机和PC驱动[15][16];2026年,所有主要AI加速器系列(英伟达Rubin、AMD MI350X/MI400、谷歌TPU v7、AWS Trainium3、Meta MTIA等)都将转向N3节点,AI将占据N3需求的大部分[20][21][22];N3需求突然汇聚导致巨大的需求冲击,台积电产能扩张未能跟上激增的AI需求[27][29] * **N3产能分配极度紧张,AI基础设施客户获得优先权**:2026年,AI相关需求(加速器、主机CPU、网络芯片)将占据N3产出的近60%,剩余40%主要用于智能手机和CPU,需求完全消耗了全部产能[36][37];预计2027年AI需求将占据N3晶圆产出的86%,几乎完全挤占智能手机和CPU份额[37][38];AI加速器设计具有更大的芯片尺寸、更复杂的封装要求和更高的平均售价(ASP),且AI驱动的需求是台积电增长的主要动力,因此AI基础设施客户在获取先进制程产能上具有相对优势[43][44];消费电子市场饱和,增长机会有限,迫使无法获得足够N3产能的客户延长产品周期或直接迁移至N2平台[45][46] * **台积电供应能力受限,短期内无法满足需求**:需求远超供应,台积电正扩大产能并将现有生产线推向极限,预计2026年下半年N3有效利用率将超过100%[47][48];增加产能受限于可用无尘室空间,新产能上线需要时间,未来两年内无法增加足够产能完全满足需求[49][50];产能紧张可能引发客户间重新分配现有晶圆配额[50] * **智能手机需求可能成为N3产能的调节阀**:智能手机是今年N3需求的第二大驱动力[55];内存价格上涨传导至手机物料清单(BOM)成本和消费者平均售价(ASP),可能抑制消费需求,智能手机需求预测可能下调至同比两位数下滑[56][57];若智能手机需求减弱,其晶圆需求将被削减,为AI加速器释放额外产能,例如将2026年智能手机N3晶圆总启动量的5%(43.7万片中的5%)重新分配,可额外生产约10万颗Rubin GPU或约30万颗TPU v7[58][60][61] * **内存(特别是HBM)成为下一个主要瓶颈**:全球内存短缺短期内不太可能缓解[65];大部分DRAM新增产能被HBM吸收,挤占了通用DRAM的空间[65][66];HBM消耗的晶圆产能大约是通用DRAM的三倍,随着向HBM4和HBM4E过渡,差距可能扩大至近四倍甚至更大[67][68] * **HBM需求受单设备容量和性能要求驱动**:HBM位元出货量剧增主要由单设备内存容量提升驱动[73];英伟达从Blackwell到Rubin Ultra使HBM容量增加50%至约4倍,TPU v8AX、Trainium3和AMD MI400等也大幅增加内存容量或堆叠层数[74][75];客户对更高引脚速度(如HBM4目标11 Gb/s)的要求,以及供应商在规模化交付时面临的良率挑战,进一步限制了有效HBM供应[76][79] * **服务器DRAM需求也在走强**:AI服务器系统内存将大幅增加,例如英伟达下一代VR NVL72机架的DDR含量将提高3倍,每颗Vera CPU配备1,536 GB[81][83];老旧的云端和企业服务器进入多年更换周期,预计2026年通用DRAM位元需求将出现上行拐点[81][83];AI工作负载推动CPU需求,CPU与GPU的比例逐渐提高[81][83] * **内存利润动态变化,可能影响HBM供应增量**:传统DDR DRAM价格飙升,其利润率已接近甚至超过已签约的HBM供应水平[87][88];为激励厂商增加HBM晶圆投入,客户可能需要支付高于当前合同水平的价格以确保增量供应[89][90];若存储供应商将产能转向HBM,传统DDR DRAM的可用位元供应将进一步收紧[90] * **消费级市场疲软可能释放部分内存产能**:位元可能从消费级应用向服务器和HBM重新分配[91];在消费级出货量削减25%的情况下,将释放约276.9亿Gb,占DRAM总需求的7%左右,且接近今年HBM需求的80%[91][93];基准预测为消费级出货量下降10-15%,释放约110.76亿Gb(占DRAM总需求约3%),不足以实质性改变整体供需动态[94][95];存储器厂商(如三星)已认识到消费端疲软,产能分配计划可能已纳入出货量下降10-15%的情景[96][98] * **CoWoS先进封装限制缓解,前端产能成为主导瓶颈**:CoWoS产能限制正在缓解[99];台积电的产能规划更多考虑N3工艺限制,而非过度投资CoWoS[99];2.5D封装有其他选择,如外包给日月光/矽品(ASE/SPIL)、安考(Amkor),或采用英特尔的EMIB方案[99] * **数据中心电力瓶颈已转变为加速器硅片供应瓶颈**:过去几年,数据中心和电力是主要制约因素[102];目前预测显示电力供应将超过AI算力需求,因为晶圆制造未能跟上数据中心供应增长[102][103];主要瓶颈已从数据中心建设和电力可用性转变为加速器芯片供应[102][103];扩建数据中心和电力设施比建造新的晶圆厂更容易[106] * **供应链控制至关重要,英伟达准备最充分**:在算力短缺环境下,成功的采购最为关键[107];英伟达锁定了逻辑晶圆、内存和各种其他必要组件的大部分供应,成为主要受益者[107][109];英伟达预见了供应紧张,积极争取供应链,例如2025年韩国之行旨在确保内存供应[107][109];当前现实是,锁定最多芯片供应的供应商将占据最多的已部署算力[107][109] 其他重要内容 * **代工竞争格局可能因产能紧张而改变**:台积电的技术领先优势在产能不足时重要性降低[31];产能限制可能促使客户寻求更多元化的代工选择,例如向获得美国政府支持的英特尔代工厂(Intel Foundry)外包[31];三星代工厂发展势头增强,获得了特斯拉AI5/AI6芯片项目(与台积电共同开发),并进入了英伟达的数据中心供应链[31][33] * **N3产能具体驱动因素与时间线**:主要驱动因素是英伟达Rubin系列的产能爬坡(从Blackwell的4NP转向N3P),但Blackwell今年出货量仍将高于Rubin[34];谷歌和博通的TPUv7芯片已于2025年投入生产,2026年出货量将因内外需求大幅增加,并开始向TPUv8过渡(仍采用N3节点)[34][35];基于N3P的AWS Trainium3将于2026年初开始投入晶圆生产,下半年大规模产能爬坡[34][35];N3需求也扩展到CPU(如Vera CPU)和网络芯片(如NVLink 6交换机、Tomahawk 6、Spectrum 6,以及3nm 200G光学DSP)[25][26] * **台积电资本支出变化**:历史上最大规模的算力建设始于2022年底,但台积电的资本支出直到2025年才超过之前的峰值[27][29];2026年,台积电将大幅突破去年的资本支出纪录[27][29]