Workflow
半导体行业观察
icon
搜索文档
盛美公布八大行星系列,再冲新高峰
半导体行业观察· 2026-03-26 08:36
行业背景与竞争逻辑 - 在AI芯片性能需求指数级增长的背景下,传统半导体工艺面临天花板,现有技术储备无法完全满足未来高算力、高带宽的复杂需求 [1] - 行业竞争的赛点已转向更深层次的差异化原始创新,只有敢于深耕“无人区”的公司才能占据价值链顶端 [1] - 拥有自主知识产权与核心专利(IP)保护是企业参与全球化服务、构建核心竞争力的基石 [1] - 坚持“技术差异化、产品平台化、客户全球化”的发展逻辑,是为全球集成电路产业提供不可替代方案的关键 [1] 公司概况与战略定位 - 盛美半导体设备(上海)股份有限公司(盛美上海)是一家成立于2005年的平台型半导体设备公司 [1][3] - 公司从清洗设备入手,通过持续创新,已发展成为全球领先的平台型半导体设备公司 [1] - 公司始终坚持“技术差异化、产品平台化、客户全球化”的发展战略 [1][5] - 公司认为半导体设备行业对可靠性和精密性要求高,全球能够做成平台化的公司很少,这需要时间的耕耘和原始创新能力 [6] 核心业务:清洗设备的发展与成就 - 清洗设备是公司最初选择切入的赛道,是芯片制造中连接光刻、刻蚀、沉积等工序的关键环节,为“制程间的桥梁” [3] - 全球半导体清洗设备市场高度集中,在单片清洗设备领域,DNS、TEL、LAM三家公司合计市场占有率接近80% [3] - 公司自2008年研发出全球首创的SAPS(空间交变相移)兆声波清洗技术,并于2011年获得首台12英寸单片清洗设备海外订单 [4] - 公司已打造SAPS、TEBO、Tahoe清洗技术“铁三角”,覆盖95%以上的半导体清洗制程环节 [4] - Tahoe单芯片槽式复合清洗设备能有效节省高达75%以上的硫酸用量 [4] - 自主研发的SCCO₂超临界CO₂干燥设备,可实现CO₂消耗量降低30%以上 [4] - 2025年上半年,公司在中国半导体单片清洗设备市场的占有率超过30% [5] - 根据Gartner 2025年报告,公司清洗设备的国际市占率达8.0%,全球排名第四 [5] 产品多元化拓展与市场地位 - 公司在电镀设备、先进封装湿法设备、立式炉管设备、前道涂胶显影设备、PECVD设备、面板级封装设备等领域扩大布局 [5] - 在电镀设备方面,公司具有全球独立IP保护,根据Gartner 2025年统计,其国际市占率为8.2%,全球排名第三 [5] - 公司位列2024年中国大陆半导体专用设备制造五强企业 [5] “八大行星”系列产品平台发布 - 在SEMICON China 2026大会上,公司发布了拥有专属商标“盛美芯盘”的“八大行星”系列产品,象征其平台化战略布局 [8][10] - “地球”系列:清洗设备。凭借SAPS/TEBO兆声波技术、Tahoe清洗技术等原创技术,实现芯片制造95%清洗工艺全覆盖 [10] - “木星”系列:晶圆级先进封装湿法设备,包括湿法去胶、湿法金属刻蚀、涂胶、显影和硅蚀刻设备 [11] - “金星”系列:电镀设备。凭借独有的多阳极技术,实现前道大马士革、中道TSV、后道先进封装全流程电镀工艺全覆盖 [13] - “火星”系列:立式炉管设备。实现了从LPCVD、中温高温回火到原子级沉积ALD的全覆盖 [13] - “水星”系列:涂胶显影设备。于2022年首次推出,2023年第三季度推出300 WPH高产出KrF设备 [13] - “土星”系列:等离子体化学气相沉积(PECVD)设备。采用全球独有的三栈等离子腔设计以及有效的RF射频控制技术 [14] - “天王星”系列:面板级封装设备。于2024年推出,包括面板级先进封装电镀设备、负压清洗设备、边缘刻蚀设备 [14] - “海王星”系列:无应力抛光设备。可实现片内以及晶粒内的原子级别抛光 [14] 公司理念与未来展望 - 公司始终以客户为中心,将客户群比作“太阳”,八大行星系列产品围绕其运转,致力于为客户提供优质服务并响应其新需求 [8][16] - 公司认为未来AI所需的许多技术和设备尚未诞生,需要持续探索和创造,只有持续创新才能满足下一代技术的需求 [16] - 公司强调与客户同频共振、并肩前行,共同开展设备研发与新工艺应用的探索,认为半导体创新是各辟新径、协同成就的过程 [16]
谁在决定良率?揭秘AI芯片狂飙背后的“隐形控制力”
半导体行业观察· 2026-03-25 08:40
文章核心观点 - 在AI算力驱动下,半导体制造进入高度复杂的系统化阶段,对制造过程的精准控制提出极致要求,底层自动化控制元件从“支持性组件”转变为“决定性变量”[2][4] - 德国自动化企业Festo(费斯托)凭借其核心技术方案,正在通过提升气动/电动元件的控制精度、稳定性和洁净度,帮助半导体前道制造将不确定性转化为可控制、可复现的系统能力[4][18] - 公司通过深度本土化战略,包括投入超过400位技术人员和在上海设立半导体创新中心,构建端到端(E2E)支持体系,以快速响应中国半导体设备厂商的需求[20] 行业背景与趋势 - AI时代晶圆制造是一个高度耦合的复杂系统,先进逻辑芯片、HBM、高带宽封装、Chiplet架构相互叠加,制造流程非线性,对精度、节拍与一致性要求极致[2] - 设备演进趋势不仅要“更快”,更要“更稳、更准、更干净”,核心命题是精准控制[2] - 影响先进制程良率的因素越来越多地来自曾被忽视的执行细节,如晶圆夹持、机械振动、液体残留等[2] - 半导体设备底层控制单元(气动系统、阀门、传感器、流体控制模块)的角色发生跃迁,从“辅助系统”变为“决定性变量”[4] - 行业对制程精度的要求已攀升至纳米级别,对元件驱动的工艺内容在意程度提升,对精度和颗粒度的要求更上一个级别[4] Festo的核心技术方案(四道防线) 1. 微米级气动定位控制 - 定位是前道制造所有工艺的物理起点,直接决定工艺稳定性与良率上限,需在更高速度下完成更高精度控制[7] - 应用贯穿涂布、光刻、显影、蚀刻、CMP、量测等多个前道制造流程[7] - 挑战在于高速运行中保证节拍、避免冲击振动、并在目标位置实现微米级精度的稳定停留[7] - Festo提供整套受控气动解决方案,通过控制算法、比例阀岛(VTEP)与运动控制器(CPX-E)协同,实现闭环控制与高精度压力调节,使标准气动执行器能达到微米级定位性能[8] - 该方案可在无法使用电机的场景下,节省空间,避免大改机械结构,精度可达甚至超过电机控制[8] 2. 非接触式晶圆翘曲解决方案 - 先进封装普及使晶圆翘曲问题普遍,成为影响键合良率的关键因素[10] - 传统夹持方式面对翘曲晶圆时,可能无法稳定夹持或引入微裂纹[10] - Festo方案结合标准气动阀与独有的压电(Piezo)技术,可精准控制压力与真空,适配翘曲晶圆的夹持与释放[10] - 支持多区独立控制,将晶圆划分多个压力区域独立调节,实现整体均匀、稳定的夹持效果[10] 3. 高精度智能气动门阀控制 - 门阀(TV/SV)开关动作是易被忽视的颗粒污染源,传统“开/关”式粗放控制会导致末端剧烈冲击与高频振动,剥离微小颗粒污染晶圆[13] - Festo的Transfer Valve门阀开关控制方案,通过比例压力控制技术对阀门气缸运动进行连续调节,将“刚性开关”变为可编程的动态过程[13] - 采用软启动与软停止策略,有效削弱冲击力,降低振动与颗粒产生[13] - 经终端厂验证,可降低90%的震动,以及降低至少50%的颗粒产生,改变整个制程窗口级别[14] - 平滑的运动控制也有助于延长阀门密封件使用寿命,提升设备长期稳定性[14] 4. 智能流体控制实现“零滴落” - 前道制造中清洗、涂布、光刻、显影、蚀刻、CMP等关键工艺依赖液体精准控制[16] - 点胶等工艺难点在于“如何结束出胶”,残液滴落可能污染晶圆表面,影响良率[16] - 传统方案依赖人工经验,回吸过程“可调但不可控”[16] - Festo基于压电技术构建智能气动控制方案,通过高精度压力调节与动态响应控制,将回吸过程转化为可数字化、可编程的控制动作,实现“零滴落、零污染”[16] Festo的中国本土化战略 - 在中国市场,响应速度是站稳脚跟的关键[20] - 公司在中国已投入超过400位技术人员,覆盖从产品设计、客制化开发到现场验证的完整技术供应链,构建端到端(E2E)支持模式[20] - 2024年在上海成立半导体创新中心,作为响应中国特殊需求的“前哨站”,并建立完全独立的质量与交货体系[20] - 本土化战略旨在助力中国半导体设备实现从“能做”到“做精”的质变[20]
悦芯科技获12亿投资,批量交付国内首台DRAM芯片ATE测试设备
半导体行业观察· 2026-03-25 08:40
公司融资与资金用途 - 悦芯科技于近日完成pre-IPO轮股权融资,获得超12亿元投资 [1] - 融资由国家产业基金、政府基金、银行及行业资本共同参与 [1] - 所获资金将重点用于公司产品研发、产能提升及市场拓展,支持高端国产半导体测试设备技术创新及自主可控 [1] - 该项融资体现了市场对悦芯科技的发展潜力和前景坚定看好 [2] 公司业务与产品概况 - 悦芯科技成立于2017年2月,从事大规模集成电路自动化测试设备的研发、生产、销售 [4] - 公司是国内率先实现同时覆盖存储器芯片、系统级芯片及功率半导体三大关键市场领域的高端半导体测试设备厂商 [4] - 公司致力于为全球市场提供创新性半导体生产测试系统解决方案 [4] - 公司核心团队长期深耕行业,汇聚了国内外相关专业技术和管理人才 [4] - 公司自主研发了具有完全知识产权的系统级芯片测试设备T800系列、存储芯片测试设备TM8000/M5000系列、功率半导体测试设备TP1200/2500系列,且均已实现产业化供货规模 [4] 技术突破与市场影响 - 国内首台用于DRAM量产测试的TM8000系列测试系统已成功大批量交付 [4] - TM8000系列解决了客户产能及供应链安全问题,以及高性能存储器芯片自动化生产测试设备的瓶颈问题 [4] - 该产品的成功交付增强了市场对国产设备自主研发能力的信心,对提升国产自动化测试设备(ATE)的行业地位发挥了积极作用 [4]
英伟达的推理芯片局
半导体行业观察· 2026-03-25 08:40
文章核心观点 文章详细解读了英伟达在2026年GTC大会上发布的一系列新产品、技术路线图及系统架构,核心观点在于英伟达正通过硬件创新、架构整合及生态扩展,巩固并扩大其在人工智能推理基础设施领域的领导地位[3]。公司通过收购Groq整合LPU技术、推出多代GPU与系统、以及布局CPO(共封装光学)等先进互连技术,旨在构建一个覆盖计算、网络、存储的完整且高性能的AI推理解决方案王国[3][93]。 产品与技术发布 - 英伟达在GTC 2026上发布了三款新系统:Groq LPX、Vera ETL256和STX,并更新了Kyber机架架构[3] - 发布了Rubin Ultra NVL576和Feynman NVL1152等多机架系统,并透露了Feynman架构的早期信息[3] - 公司CEO黄仁勋在主题演讲中特别提及了InferenceX,凸显了其对推理市场的重视[3] Groq收购与LPU技术整合 - 英伟达以支付200亿美元获得知识产权许可和团队的形式“收购”了Groq,此举规避了严格的反垄断审查并加速了技术整合[4] - 交易宣布不到四个月,Groq的LPU(语言处理单元)系统概念已被集成到Vera Rubin推理堆栈中[4] - Groq LPU采用独特的“切片”架构,通过高带宽SRAM和确定性执行实现极低的延迟,擅长快速处理token,但与GPU相比在总吞吐量上存在权衡[5][6][8] - 第一代LPU采用GlobalFoundries 14nm工艺,而计划中的第二代LPU因设计问题(SerDes速度未达标)从未量产[6][7] - 英伟达将直接推出第三代LPU(LP30/LP35),跳过有缺陷的第二代,采用三星SF4X工艺,拥有500MB片上SRAM和1.2 PFLOPS的FP8算力[9][14] - 下一代LP40将采用台积电N3P工艺和CoWoS-R封装,集成英伟达自有IP(如NVLink),并与Feynman平台协同设计[15] GPU与LPU协同推理架构(AFD) - 英伟达引入LPU旨在提升高交互场景下的推理性能,利用其低延迟特性加速解码阶段[19] - 提出了注意力前馈神经网络解耦(AFD)技术,将Transformer模型中的注意力机制(有状态、动态)映射到GPU执行,而将前馈网络(FFN,无状态、静态)映射到LPU执行[21][25] - 这种解耦允许GPU的HBM容量更专注于键值缓存(KV Cache),从而支持更多的并发用户[23] - 采用乒乓流水线并行机制来隐藏GPU与LPU之间token路由(分发与合并)产生的通信延迟[27][29] - LPU还可用于部署推测性解码中的草稿模型或多token预测层,以进一步提升解码效率[32] LPX机架系统 - LPX机架系统包含32个1U计算托架,每个托架(节点)包含16个LPU、2个Altera FPGA、1个Intel Granite Rapids CPU和1个BlueField-4前端模块[35][38] - LPU模块采用背靠背方式安装在PCB上,以优化布线[41] - FPGA作为“架构扩展逻辑”,承担协议转换(C2C转以太网/PCIe)、控制流管理以及提供额外DDR5内存(每个FPGA高达256GB)供KV Cache使用的角色[43] - LPU网络分为节点内全网状连接、通过铜背板的节点间/机架内连接,以及通过OSFP笼(可能使用AEC或光模块)的机架间连接,机架内纵向扩展总带宽达640TB/s[44][46][48][52] 英伟达CPO路线图与互连技术 - 英伟达公布了其CPO路线图,重点用于构建超大规模计算系统的机架间互连,而非机架内部[54] - 在Rubin时代,NVL72(Oberon机架)和NVL144(Kyber机架)采用全铜缆纵向扩展;NVL576系统(8个Oberon机架)将在机架间采用CPO互连[55][60] - 在Feynman时代,NVL1152系统(8个Kyber机架)将“完全采用CPO”,但机架内部GPU到交换机的连接预计仍使用铜缆[56][60] - 公司的策略是尽可能使用铜缆,仅在必要时(如长距离、高密度机架间连接)采用光纤/CPO[56] Kyber机架与Rubin Ultra系统更新 - Kyber机架是Oberon之后的新产品,每个机架可容纳144个Rubin Ultra GPU(原设计为72个),计算刀片密度提升[61] - 每个Kyber机架包含72个NVLink 7交换芯片,GPU通过飞线(flyover cables)连接到中板上的交换芯片[63][70] - Rubin Ultra NVL144 Kyber机架将使用全铜缆扩展,而非CPO[65] - 供应链中讨论了NVL288(两个Kyber机架通过铜背板互连)和NVL576(八个Oberon机架通过CPO互连)等更大规模系统[73][76][78] Vera ETL256高密度CPU系统 - Vera ETL256是一个独立的液冷机架,集成了256个Vera CPU,旨在解决AI工作负载中日益增长的CPU需求瓶颈[79] - 机架内部采用Spectrum-X多平面拓扑,通过铜缆实现所有CPU的完全全连接,无需光模块[80][81] - 该设计将计算资源紧密排列,用铜缆的成本节约来抵消液冷的额外开销[79] CMX与STX存储解决方案 - CMX(原称ICMS)是英伟达的上下文内存存储平台,旨在通过NVMe存储扩展键值缓存(KV Cache)容量,解决长上下文推理的瓶颈[84][85] - STX是一个参考存储机架架构,采用基于BlueField-4的存储解决方案,规定了与Vera Rubin计算集群配套所需的硬盘、CPU、DPU、网卡和交换机的数量[87][90] - 这些举措代表了英伟达将其影响力从计算和网络层向存储及基础设施标准化层拓展的努力[92]
存储芯片短缺,全面蔓延
半导体行业观察· 2026-03-25 08:40
当前内存市场短缺现状与影响 - IDC指出,DRAM和NAND闪存价格上涨及供应趋紧正在重塑2026年智能手机和PC市场格局[2] - TrendForce预测,2026年第一季度PC DRAM合约价格将环比上涨超过100%[2] - SK海力士曾警告内存短缺可能持续到2030年,且压力已不局限于HBM闪存[2] - 美光科技表示,DRAM和NAND闪存供应不足限制了人工智能和传统服务器的需求[2] - 美光指出,洁净室产能限制、生产周期长及HBM占比过高导致供应无法快速扩张[2] - 三星在其2025年中期业务报告中指出,供应商专注于服务器产品导致PC和移动设备供应紧张[2] - 行业观点认为,一旦供应商追求利润率,主流DRAM将不再平庸,而是会适应AI发展步伐[2] 行业应对措施与未来投资 - SK海力士计划在龙仁新建工厂投资约21.6万亿韩元(约150亿美元),并将首个洁净室启用时间提前至2027年2月[3] - SK海力士此前在2024年4月宣布,位于清州的M15X项目将投资超过5.3万亿韩元(约40亿美元)以扩大包括HBM在内的下一代DRAM产能[3] - 三星计划在2026年投资超过110万亿韩元用于工厂建设和研发,以巩固其在AI半导体领域的领先地位[3] - 世界半导体行业协会预测,2026年半导体市场将以存储器为主导实现强劲增长,市场普遍认为不会出现供过于求[3] - 整个行业正在为远超当前AI领域之外的市场规模进行建设[3] 对供应过剩的潜在看法与需求端分析 - 即使未来出现供应过剩,对树莓派用户、PC组装商、设备制造商和游戏玩家而言,更像是期待已久的喘息之机[4] - 市场对持续短缺的需求并非绝对,DeepSeek在其技术报告中指出,完整的训练过程耗费了278.8万H800 GPU小时,官方训练成本为557.6万美元[4] - 上述数据削弱了“AI的每一项实用进步都必须无休止地投入硬件”的观点[4] - 如果大规模产能扩张恰逢AI基础设施支出变得谨慎,下一次内存过剩或被视为内存恢复正常运行的转折点[4]
日月光,又买了一个工厂
半导体行业观察· 2026-03-25 08:40
交易概述 - 全球半导体封测龙头日月光投控旗下矽品以63.25亿元新台币的价格,买下群创位于台南的南科五厂[2] - 交易标的为建物面积约13.9万平方公尺(约4.2万坪)的厂房及附属设备,每坪单价约15万元新台币[2] - 群创预计通过此次资产处分获得约58亿元新台币的处分利益,以当前实收资本额估算,约可贡献每股纯益0.72元新台币[2] 卖方(群创)动机与影响 - 交易旨在优化资产配置、活化资金运用,并充实营运资金以支持未来发展[2] - 体现公司精实资产管理策略,通过以优于专业估价的金额将资产变现,加速转型[3] - 处分所得将有助于充实资金,支持后续技术研发与产业布局,例如深耕利基型面板和跨足面板级扇出型封装等高阶技术[3] - 交易有助于提升公司资产效率、美化帐面获利,并在转型过程中保有更佳的财务弹性[4] 买方(日月光投控/矽品)动机与策略 - 采取“短期扩产、长期卡位”策略,通过取得现有厂房可快速导入产线,缩短建厂时程[3] - 收购厂房旨在第一时间取得产能以进行扩产,争取更多AI商机[2] - 同步取得中科二林园区约8.04万平方公尺用地20年土地使用权,资产金额约3.44亿元新台币,合计投资金额超过66亿元新台币[3] - 此举是为因应中长期营运需求,提前布局中南部产能据点,以应对AI带动的先进封装订单成长[3] 行业背景与趋势 - 随着英伟达等AI芯片出货畅旺,以及云端服务供应商积极投入自研ASIC,带动先进封装需求急速攀升,出现产能供不应求并外溢至封测厂的情况[3] - 日月光投控作为全球最大封测厂,在AI浪潮推升主要客户订单下,扩产需求明显升温[3] - 在AI需求持续扩大带动下,封测产能布局成为关键[4]
“中国版Ayar Labs”光联芯科获红杉、高瓴、君联共同押注
半导体行业观察· 2026-03-25 08:40
公司融资与市场地位 - 国内光互连领军企业光联芯科已累计完成数亿元融资,近期新一轮由君联资本领投,红杉中国、高瓴创投等老股东持续超额追投[2] - 融资节奏迅猛,未大面积接触机构即快速完成,最终以超额认购收官[2] - 成立仅两年已完成四轮融资,刷新了中国光互连早期项目的估值水平[2] 行业趋势与赛道热度 - 光互连是决定AI算力上限的隐形赛道,正在引爆[2] - 多位一线半导体行业投资人认为,跟算力传输相关的项目很热,其中光互连是确定性最强的下一代主线,评价为“热、卷”[2] - 2026年两会“算电协同”首次写入政府工作报告,算力发展进入“能效并重”新阶段,赛道关注度上了一个台阶[3] - 大模型与具身智能爆发,GPU从单卡竞赛转向集群竞赛,算力瓶颈逐渐从计算本身转向连接[3] 技术路径与公司定位 - 光互连技术用光代替铜线,让芯片之间直接对话[3] - 光联芯科定位为AI大算力时代的光互连架构建造者,赋能下一代AI算力中心迈向“全光互连”[4] - 公司技术聚焦芯片级光I/O,直接面向芯片内部互连,将光引擎与芯片共封装,实现“电算光连”全新架构,让数万GPU高效协同如同一颗芯片[4] - 公司坚持全国产化技术链和垂直整合,从芯片设计、光引擎到封装测试全产业链自主可控[6] - 公司开辟了一条不依赖国外先进制程的发展路径,工程迭代速度不输于国外且成本更低[6] 市场前景与竞争格局 - 光互连领域先驱、硅谷初创公司Ayar Labs近期完成5亿美元E轮融资,估值达37.5亿美元,背后有英伟达、AMD、英特尔、联发科等芯片巨头支持[3][4] - 光联芯科被视为中国版的Ayar Labs[4][6] - 未来数据中心将向“全光互连”发展,芯片直接出光,带宽能力可提升多个数量级,成本和功耗可能降低到百分之一[6] - 预计到2030年,该技术可能催生一个比光模块更大的市场[6] - Ayar Labs预计其2028年年出货量将超过1亿颗[6] - 中国市场占全球AI算力投资的三分之一[6] - 光联芯科的天花板将不逊于任何一家国产GPU厂商[6]
ASML千名员工罢工,抗议裁员
半导体行业观察· 2026-03-25 08:40
公司重组与裁员行动 - 公司计划裁减1700个职位,占员工总数的3.8% [2] - 裁员是更广泛战略重组的一部分,旨在精简3000个中层管理职位,并让工程师团队聚焦于创新 [2] - 裁员主要影响技术和IT团队的领导层职位,以及生产支持、质量保证和行政部门 [3][4] - 位于荷兰费尔德霍芬的主要EUV光刻机生产基地将裁员约1200人,美国康涅狄格州威尔顿工厂将裁减500个岗位 [4] - 公司计划在六个月内完成裁员,并为受影响员工提供遣散费和再培训机会 [4] 员工抗议与工会回应 - 超过1000名员工在荷兰总部举行午间罢工,抗议裁员决定 [2] - 荷兰最大工会FNV要求公司“推倒重来”,拿出一份不涉及强制裁员的方案 [2] - 工会指出,公司预计2025年将实现96亿欧元(约111亿美元)净利润,且计划未来三年回购价值120亿欧元的股票,完全有能力审慎行事 [2] - 公司表示尊重工会,理解员工的诉求,但重组工作仍在继续 [2] - 工会预计于4月7日对公司提出的社会计划做出回应,公司内部职工委员会将于5月提出正式建议 [2] 重组背景与战略动因 - 裁员源于公司战略转型,旨在将自动化和人工智能融入整个制造流程 [3] - 尽管销售额依然强劲,尤其是极紫外(EUV)光刻系统,但管理层认为优化劳动力结构对保持竞争优势和投资下一代技术势在必行 [3] - 重组旨在加强对工程和创新的关注,公司计划创造新的工程岗位,但未透露具体数量 [3] - 关键EUV系统的客户交付计划不会受到此次重组的影响 [4] - 专注于下一代EUV技术开发的工程和研发团队基本不受此次裁员影响 [4] 行业环境与外部压力 - 随着半导体行业成熟,芯片生产日益集中在少数几家先进代工厂手中,设备制造商需要精简运营流程 [3] - 公司决定也反映出其为应对潜在市场波动所做的准备,因为地缘政治紧张局势持续影响着全球半导体供应链 [3] - 半导体设备出口,特别是对某些国际市场的出口,受到更严格的监管审查,这要求公司重新分配资源以应对合规问题并开发替代市场 [3]
芯片的未来,靠它们了
半导体行业观察· 2026-03-25 08:40
行业核心观点 - 高性能计算正从单一硅片的“单片集成”时代,转向通过先进封装和互连技术将功能模块解耦并重新集成的架构变革时代,性能提升的驱动力从晶体管微缩转向了更高效的数据传输架构设计 [2][3][4] - 物理学(光刻视场限制)和经济学(数据传输能耗剧增)共同推动此变革,行业通过将处理器拆分为计算、缓存、I/O等专用小芯片单元,并利用先进封装集成,以应对挑战 [3] - 玻璃基板、通用小芯片互连标准(UCIe)和计算快速互连(CXL)是促成这一转型的三项关键技术,它们共同推动了“超越摩尔定律”的发展趋势 [3][4] 玻璃基板技术 - 玻璃基板正成为重要的先进封装平台,用以替代传统的有机基板,旨在减少封装翘曲并支持更大尺寸(约100 mm × 100 mm)的封装体,其互连密度远高于有机基板方案 [4][5] - 行业转向玻璃基板的主要原因是有机基板在机械和热性能上已接近极限,随着封装尺寸增大和功耗攀升(如大型AI加速器),其翘曲问题及热膨胀系数不匹配导致的应力问题难以管控,影响良率 [7][9][10] - 玻璃基板(如硼硅酸盐玻璃)的热膨胀系数可与硅芯片更紧密匹配,减轻翘曲,其高刚性和优异的尺寸稳定性支持更高密度的基板级布线和垂直互连,例如玻璃通孔间距可缩小至约100 µm,密度比有机基板提升约一个数量级 [11][12][13] - 玻璃通孔利用激光诱导深刻蚀等工艺形成,支持高深宽比(如20:1)和精细特征(直径小至75微米),缩短信号路径并降低电阻与电感 [14] - 玻璃作为介质材料具有更低的损耗角正切值,有利于高频信号传输和保持信号完整性,并因其光学透明性和尺寸稳定性,有望支持与光子技术(如共封装光学)的紧密集成 [15][16] - 英特尔计划在本十年后半段引入玻璃基板,并在2026年CES上发布了首款采用玻璃核心基板大规模量产的Xeon 6+处理器,SKC子公司Absolics目标在2025年内实现量产准备,三星电子和三星电机也在积极研发,预计2030年玻璃核心基板市场规模在乐观情景下有望达到4.6亿美元 [5][6] 通用小芯片互连标准(UCIe) - UCIe是一项标准化的裸片间互连接口技术,旨在使来自不同工艺节点及不同供应商的小芯片能够在同一封装体内实现协同工作,解决了小芯片互操作性和生态系统局限性的问题 [4][18] - UCIe标准的演进体现了行业的迅速采纳,UCIe 3.0版本于2025年8月发布,支持高达64 GT/s的单通道数据速率,带宽较早期版本翻倍,并扩展了对3D集成(如混合键合)的支持 [18][20] - UCIe的价值在于使基于小芯片的设计更具模块化和成本效益,允许将CPU内核、I/O模块和加速器等不同功能单元采用最适合的工艺节点制造(如尖端节点用于计算,成熟节点用于I/O),并通过标准化接口实现低延迟、高可靠的通信 [22][23][24] - UCIe采用分层架构,包括物理层(分标准封装和高级封装)、裸片间适配层(负责链路可靠性)和协议层(支持映射PCIe、CXL等多种协议),提供了灵活性和多功能性 [25][26] - 行业采纳的重要标志是NVIDIA已转而采用UCIe来集成客户定制的IP模块,同时通过“UCIe转NVLink”的桥接小芯片与其专有NVLink架构对接,体现了混合技术方案的趋势 [27][28] 计算快速互连(CXL) - CXL技术旨在解决“内存墙”问题,通过将内存与CPU解耦,实现跨组件的内存扩展与内存池化,从而提升内存资源利用率并解决AI集群中普遍存在的“孤立内存”问题 [4][30] - CXL已从点对点链路演进为真正的交换互连架构,CXL 3.0/3.1实现了多级交换和互连架构能力,支持多达4096个节点,其点对点能力允许加速器直接访问CXL内存,降低延迟和CPU开销 [31][32][34] - CXL的核心经济驱动力在于消除“闲置内存”,据微软估算,在Azure云平台中任何时刻都有高达25%的内存处于闲置状态,通过内存池化,可将整体内存需求降低7%至10%,服务器综合成本降低4%至5,为超大规模数据中心运营商每年节省数亿美元 [35][36] - 硬件实现方面,三星推出了CMM-D(CXL内存模组)和CMM-B(机架级内存池设备),并开发了管理软件;SK海力士推出了Niagara 2.0池化内存平台和CMM-Ax(内置逻辑单元的计算内存模块),可直接在内存内部执行计算任务,提升特定场景性能 [37][38][39][40] 技术集成与未来展望 - 2026年技术路线图的核心特征是玻璃基板、UCIe和CXL技术的融合,形成“系统级封装”(SoP)架构,催生新型的模块化、适用于AI工作负载的“封装系统”计算机 [41][48][49] - 未来最尖端AI处理器架构将基于玻璃基板,计算功能被拆分为多个通过UCIe 3.0互连和3D堆叠的小芯片,并集成HBM4存储和CXL 3.0接口以访问机架级共享内存池 [42][43] - 高集成度带来高功率密度,先进加速器封装功耗已达1,500W至2,000W,未来可能升至数千瓦,玻璃基板的耐高温特性和尺寸稳定性支持更激进的散热方案 [44] - 技术路线图的下一步是光子技术的全面集成,玻璃基板有望成为推动光子集成的关键,支持光波导嵌入,而光学I/O接口(如Ayar Labs的方案)可打破带宽与传输距离瓶颈,支持构建更大规模的AI计算架构 [45][47]
Arm首颗自研芯片:3nm CPU,136核
半导体行业观察· 2026-03-25 06:52
核心观点 - Arm公司发布其首款专为人工智能数据中心设计的专用CPU——Arm AGI CPU 此举标志着公司打破了三十多年来仅授权IP的商业模式 直接进入芯片制造和销售领域 旨在满足AI基础设施激增的计算需求 并为客户提供更多选择[1] - 该芯片的发布被视为公司发展历程中的重要时刻 预计将带来数十亿美元的收入 并对x86阵营构成新的冲击[1][22] 产品发布与战略转变 - Arm发布名为Arm AGI CPU的专用数据中心处理器 直接设计和销售芯片 打破了其长期以来的IP授权商业模式[1] - 公司高管强调 无论是提供IP、CSS还是如今的芯片 所有行动的核心目标都是为了满足客户需求[1] - 该决策被视为公司在AI基础设施需求巨大转变背景下的战略选择 旨在为客户提供更多选择[1] 产品规格与设计 - Arm AGI CPU是一款300瓦处理器 由两个采用台积电3纳米工艺制造的Chiplet组合而成 拥有136个Neoverse V3核心 最高主频3.7 GHz[6] - 每个核心配备2 MB的L2缓存 并拥有128 MB的共享系统级缓存[6] - 支持96条PCIe 6.0通道和CXL 3.0 支持12通道DDR5内存 最高速度8800 MT/s 总带宽825 GB/s 相当于每个核心6 GB/s[6] - 设计上放弃了同步多线程技术 旨在让每个核心用一个线程实现更确定的性能扩展[9] - 设计时避开了对目标AI工作负载无益的传统功能或加速器 是一个全新的设计[8] 市场定位与竞争优势 - 该芯片专为最新一波智能体人工智能浪潮设计 据称每GW所需的CPU数量将是去年的4倍 即每千GW需要1.2亿个CPU核心 而过去为3000万个核心[3] - 公司声称该芯片将成为市场上最高效的智能体CPU 与英特尔和AMD的最新x86芯片相比 每瓦性能更高 能为客户节省巨额电费和资本支出[11] - 除了作为AI代理的核心 该芯片还可作为定制加速器的前端节点 或用于网络、存储领域的通用CPU[8] - 产品定价将具有竞争力 旨在为那些无力自行生产内部处理器的公司提供一个选择[20] 客户与合作 - Meta是Arm AGI CPU的首个客户 双方合作开发该芯片以支持日益增长的AI工作负载和通用计算 Meta计划用其完全替代当前的数据中心计算CPU[13][20] - 其他已同意购买该芯片的客户包括OpenAI、SAP、Cerebras、Cloudflare、SK Telecom和Rebellions[16] - 公司CEO透露 虽然首批客户中没有中国客户 但中国是公司很重要的市场[16] - 公司预计AGI CPU将在2024年下半年达到全面量产状态[16] 生态系统与部署支持 - 为帮助客户部署 公司提供了参考服务器设计 包括一个标准的36kW风冷机架设计 可容纳30个双节点刀片服务器 总计提供8160个核心[17] - 公司与Supermicro合作开发了200kW液冷设计 可容纳336个Arm AGI CPU 提供超过45000个核心[17] - 该项目于2023年启动 公司斥资7100万美元 耗时约18个月 在德克萨斯州奥斯汀新建了三间实验室 团队规模已发展到1000多人以推动芯片落地[19] 行业影响与公司基础 - 此次发布标志着Arm在芯片行业长期保持的中立“瑞士”地位被打破 可能引发其IP授权客户对未来产品规划的担忧[21] - 该芯片的诞生建立在公司过去几十年在IP、CSS以及Neoverse产品上积累的经验基础上 其面向基础设施的Neoverse核心迄今出货量已达12.5亿颗[13] - 公司CEO表示 这标志着Arm计算平台进入下一个阶段[3]