MI300系列AI加速器
搜索文档
3.5D封装,走到台前
半导体行业观察· 2026-03-07 11:07
文章核心观点 - 在“后摩尔时代”,为满足AI与高性能计算(HPC)爆炸式增长的算力需求,半导体行业正从依赖先进制程转向多维空间架构的突破,其中先进封装技术成为核心战场 [2][4] - 博通(Broadcom)近期交付了业界首款基于2nm工艺和其3.5D XDSiP(超大尺寸系统级封装)平台的定制计算SoC,标志着2nm工艺与先进封装的首次结合,并凭借面对面(F2F)堆叠等技术实现了互连信号密度提升7倍、接口功耗降低10倍的突破 [2] - 3.5D封装融合了2.5D的平面互连优势和3D的垂直堆叠能力,通过Chiplet(小芯片)模块化设计,允许计算、内存和I/O采用不同工艺独立优化,为构建大规模、高效能AI芯片提供了全新解决方案,正成为行业巨头竞相布局的新焦点 [4][16][58] 先进封装的演进与重要性 - 随着摩尔定律失速和AI算力需求激增,芯片封装技术的重要性被提升到前所未有的高度,以2.5D/3D封装和Chiplet为代表的先进封装技术成为提升芯片集成度、性能和降低功耗的关键 [6] - 到2028年,2.5D及3D封装预计将成为仅次于晶圆级封装的第二大先进封装形式 [6] - **2.5D封装**:通过在硅中介层上集成多个裸die,实现芯片间高速互连,是2008年由赛灵思率先应用于FPGA的过渡技术 [8] - **3D封装**:通过垂直堆叠多个裸芯片,并借助硅通孔(TSV)等技术实现层间通信,极大缩短电子传输路径,是突破“内存墙”、实现高带宽低功耗异构集成的核心技术 [11] - 2.5D与3D封装已成为台积电、三星、英特尔等巨头从制程竞赛转向封装维度竞争的核心支点 [14] 3.5D XDSiP封装的技术细节与优势 - 博通的3.5D XDSiP是一个成熟的模块化多维堆叠芯片平台,结合了2.5D技术和采用面对面(F2F)技术的3D IC集成 [16] - **核心技术:面对面(F2F)堆叠**:与传统“面背堆叠”(F2B)不同,F2F在键合前将芯片正面相对,实现更直接的芯片间互连,省去了硅通孔(TSV),从而缩短距离、提升信号传输效率并增强机械稳定性 [19] - **核心技术:混合铜键合(HCB)**:这是相较于2.5D和3D封装的核心差异化优势,它直接连接芯片正面的铜柱布线,无需使用焊球,可实现每平方毫米数千甚至数万个连接点(例如,传统凸点间距50微米约400个连接,混合键合10微米间距可达10000个以上连接),从而实现超高密度互连 [19][21] - **性能提升**:该平台使堆叠晶粒间的信号密度增加7倍,功耗降低至原来的十分之一(即降低10倍),并减少延迟 [25] - **设计流程**:首先将芯片功能拆解为多个Chiplet,每个Chiplet可采用最适合其功能的制造工艺进行优化,例如计算核心用最先进制程(如2nm),而I/O、缓存等模块可采用更成熟、低成本的工艺 [29][32] - **命名逻辑**:业内形容“2D封装加上Interposer后就变成了2.5D,那么3D封装加上Interposer就变成了3.5D” [32] 行业主要参与者的3.5D布局与进展 - **博通(Broadcom)**:其3.5D XDSiP平台已交付给首位客户富士通,用于其基于台积电2nm的Monaka处理器(拥有144个Armv9 CPU内核)[2][29];该平台赢得的订单中约80%是搭载HBM的XPU(定制加速芯片)[38];平台支持最多12个HBM堆叠,超过12个堆叠的设计正在开发中 [38];预计到2027年,基于该技术的芯片销量将至少达到100万颗 [39] - **AMD**:2023年6月发布的MI300系列AI加速器是首家将3.5D封装技术引入量产的计算巨头 [35];其技术融合了台积电的SoIC(3D堆叠)和CoWoS(2.5D中介层),使MI300X容纳1530亿个晶体管和192GB HBM3内存,AI推理性能据称是英伟达H100的1.6倍 [37] - **台积电(TSMC)**:通过其3DFabric平台(CoWoS系列2.5D技术与SoIC 3D堆叠技术)为AMD、博通等客户的3.5D实现提供底层支撑 [46];计划在2025年底将CoWoS产能提升至每月7万至7.5万片,并计划在2027年推出9倍光罩尺寸的超大型CoWoS封装以及系统级晶圆(SoW-X)技术,目标将单个封装算力提升40倍 [46] - **三星(Samsung)**:展示了3.5D配置路线图,计划在2027年使用1.4nm芯片堆叠在2nm芯片上 [39][41] - **英特尔(Intel)**:其3.5D技术是在带有硅桥的基板上实现,旨在以更具成本效益的方式获得高密度互连优势,而无需使用巨大的单片中介层 [42][43] - **其他客户/合作**:苹果据传正与博通合作开发其首款AI服务器芯片(代号Baltra,预计2026年量产,采用台积电N3P工艺)[39];博通也为谷歌等科技巨头打造定制XPU,用于规模可达百万个AI加速器的庞大服务器集群 [39] 3.5D封装面临的挑战与未来发展需求 - **热管理**:在3.5D组件中管理热量仍然是一个重大挑战,动态热梯度可能缩短芯片寿命和可靠性 [49][50] - **成本与良率**:工艺复杂性和制造成本是制约其大规模应用的主要因素,需要进一步降低成本和提高良率 [49] - **设计与数据管理**:设计复杂系统涉及的数据量爆炸性增长,有效处理数据并减少模拟分析时间是主要挑战 [51];确保信号时序收敛(时序收敛)也变得越来越复杂 [54] - **EDA工具与标准化**:EDA工具需要发展以处理3.5D设计的复杂性,并改善IC设计师与封装专家的协作 [55];像UCIe这样的行业标准对于提高组装便利性至关重要 [55] - **工艺与组装**:需要确保3.5D组装各个步骤的工艺一致性,并管理具有不同特性的各种裸片的热、电和机械连接(组装复杂性)[54][56] - **生态合作**:实现3.5D封装需要芯片厂商、EDA供应商、代工厂、OSAT(外包半导体组装和测试)和系统集成商等整个半导体生态系统的持续合作 [56] - **未来愿景**:3.5D封装的最终目标是实现芯片设计的“即插即用”方法,设计者可以从Chiplet库中选择并快速集成,这可能在未来几年内从HBM与定制处理器的堆叠开始实现 [47]