半导体行业观察
搜索文档
天下苦DRAM久矣
半导体行业观察· 2026-07-05 10:39
核心观点 - 数据中心正面临由AI业务扩张引发的内存(DRAM)资源危机,价格暴涨与供给刚性成为制约AI算力部署的关键因素[1] - DRAM价格飙升的根源在于HBM(高带宽内存)对产能的持续蚕食,且产能扩张速度远低于AI需求增长速度[2] - 行业正通过多种技术路径重构AI推理的内存层级,旨在减少对昂贵DRAM的依赖,将温冷数据下沉至成本更低的NAND闪存,以平衡性能与成本[27] DRAM危机现状与成因 - **价格暴涨**:64GB DIMM内存价格在2025年第三季度至2026年第一季度间上涨3.5倍,预计到2026年第三季度累计涨幅达5倍[1]。2026年第一季度DRAM合约价季增幅度高达93%至98%,第二季度预计再涨58%至63%[1] - **成本高企**:服务器级DDR5 RDIMM现货单价达每GB 27至37美元,搭建一个12TB内存池的纯DRAM硬件采购成本接近50万美元[1][22] - **供给短缺**:HBM在DRAM晶圆产能中的占比从2020年的2%攀升至2026年预估的25%[2]。2025至2027年,HBM投片量占整体DRAM投片量的比例分别为18%、22%和约30%[2]。一片HBM晶圆消耗约三片DDR5的产能[2] - **产能扩张缓慢**:先进DRAM制程依赖昂贵的EUV光刻机(单台约2亿美元),晶圆厂建设周期长达数年,产能扩张速度远不及AI需求增长[2] - **供需失衡预测**:不计国产厂商影响,2026年全球存储bit供给增长仅为7%至8%,DRAM与NAND合计可能出现约15万至20万片/月的供给缺口[3] - **影响范围扩大**:内存成本上涨已从数据中心蔓延至消费端,如Xbox因内存成本两年上涨约五倍而无法生产足够游戏主机,苹果也对多款产品涨价[3] - **成本占比剧增**:在服务器物料清单中,DRAM成本占比从2023年的约50%攀升至2026年年中的60%至90%,平均约75%[3] - **利用率低下**:Meta等厂商实测数据显示,数据中心内存普遍仅有约一半容量承载活跃的“热数据”[4] 行业技术解决方案 AMD:AI预测调度与软件分层 - AMD通过收购MEXT公司,引入基于AI的内存分层技术,将冷数据从DRAM下沉至NAND闪存[5] - MEXT的预测内存引擎以内存页为粒度监测访问模式,通过AI模型预测并预取数据,对应用和操作系统透明[7] - 该方案可将系统有效内存容量提升2至4倍,基础设施整体成本下降约50%[9]。在Neo4j图数据库等场景中,DRAM与闪存1:1配置可达纯DRAM约95%的吞吐量[9] - 成本节省示例:在戴尔服务器上,1.5TB内存配置成本从9.9万美元降至3万美元,节省70%;在AWS上,1TB月度成本从8145美元降至4413美元(节省46%)或2719美元(节省67%)[9] Apple:端侧大模型与闪存存储 - 苹果通过稀疏激活架构,将200亿参数的AFM 3 Core Advanced端侧大模型完整存放在NAND闪存中,推理时仅将10亿到40亿参数的工作集调入DRAM[14] - 采用按提示词粒度的路由机制,配合高比例常驻DRAM的共享专家,减少数据交换次数,将DRAM峰值占用控制在2GB至8GB区间[17] - 该技术基于此前《LLM in a Flash》论文研究,可在CPU和GPU上分别实现比朴素加载快4至5倍和20至25倍的推理速度[18] Marvell:硬件压缩与CXL内存扩展 - Marvell发布Structera系列CXL控制器,内置硬件压缩模块,通过定制化LZ4算法对数据进行实时压缩/解压,对应用透明且不占用主机CPU算力[21] - 根据数据类型,1GB物理DRAM可发挥2至3.64倍的等效逻辑容量,混合数据库场景平均压缩比达3.64:1[21] - 方案支持将退役的DDR4内存纳入CXL内存池,并实现多服务器内存池化,优化资本开支[22] - 以12TB内存池为例,按3倍压缩比估算,物理DRAM采购量可缩减三分之二,节省三十余万美元[22] 闪迪:高带宽闪存与封装创新 - 闪迪联合SK海力士推动高带宽闪存标准化,提出将高容量NAND闪存堆叠在GPU下方的“GPU下的NAND”架构,缩短数据传输距离[23] - HBF目标容量为同体积HBM的8至16倍,成本具备显著优势,定位介于HBM和SSD之间,主打读取密集型场景[23] - 双方计划在2026年下半年推出首批HBF样品,2027年初应用于AI推理设备,目标构建HBM、HBF、SSD三级内存架构[24] - 据韩国新荣证券预计,HBF市场有望在2027年形成,到2030年增长至120亿美元规模[25] 历史对照与行业影响 - **3D XPoint的教训**:英特尔与美光曾推出的3D XPoint技术,因成本追平DRAM而性能仅比闪存快数倍,加之封闭策略,最终项目终止[26] - **行业方向**:多种技术路径共同指向AI推理内存层级的重构,热数据留于DRAM/HBM,温冷数据下沉至闪存,形成多层存储架构协同[20][27] - **传导效应**:内存层级重构将沿产业链产生传导效应,NAND原厂等环节可能直接受益[20]
HBM,竞争加剧
半导体行业观察· 2026-07-05 10:39
文章核心观点 - 美光科技正在日本广岛工厂扩建下一代AI存储器生产线,以应对AI服务器对高带宽内存激增的需求,并追赶SK海力士和三星电子主导的HBM市场 [1] 美光科技的投资与生产计划 - 美光科技在日本广岛工厂举行新生产大楼奠基仪式,项目总投资额达1.5万亿日元(约合14万亿韩元)[3] - 日本经济产业省决定提供最高达5360亿日元的配套资金支持该项目 [3] - 新生产大楼计划用于生产AI计算的下一代DRAM工艺以及HBM4E等先进产品 [3] - 公司计划从2028年下半年开始引入生产设备,并逐步扩大生产规模 [4] - 此次扩建是美光为应对全球内存供应短缺而采取的产能扩张战略的一部分 [4] 技术路线与产品规划 - 美光考虑在新工厂采用最先进的1γ(Gamma)DRAM工艺进行生产 [3] - 下一代1δ(Delta)DRAM和下一代HBM产品HBM4E也包含在生产目标中 [3] - HBM4系列是下一代产品,其数据通道比HBM3E更宽,能使AI半导体更快处理更多数据 [3] 市场竞争格局与影响 - 美光的扩张预计将对目前由SK海力士主导、三星电子和美光紧随其后的HBM市场格局产生中长期竞争压力 [4] - 随着美光着手确保面向HBM4E之后几代产品的生产基地,预计2028年后三家存储器公司在下一代HBM市场的竞争将更加激烈 [4] 日本政府的战略与期望 - 日本政府对“半导体供应链重建”寄予厚望,正大力支持美光、台积电及Rapidus等公司的投资与建厂计划 [4] - 日本经济产业大臣表示,由于生成式AI发展导致存储器需求增长,在国内生产存储器并为世界做出贡献意义重大 [5] - 广岛县期望这项投资能够加强当地供应链,并创造超过1000个就业岗位 [5]
AI算力供需重构,迈入深水区
半导体行业观察· 2026-07-05 10:39
AI算力产业趋势与核心变化 - 行业核心叙事正从大模型训练转向推理应用,推理算力需求增速远超训练算力 [1] - 据TrendForce数据,北美五大云服务商2026年AI训练算力预计增长超过50%,而推理算力将暴增122% [1] - 中国市场推理算力增长更快,IDC预测到2029年推理算力占比将接近八成 [1] - 产业核心矛盾从“能否买得到”算力,转变为“配得齐、用得满、接得上”的系统工程难题 [1] - 黄仁勋提出“Token工厂经济学”,将数据中心定义为生产Token的工厂,算力正从采购行为变为类似水电的基础设施刚需 [20] 2026 WAIC “重构算力”产业链接会概况 - 会议将于2026年7月18日在上海张江科学会堂举行,是2026世界人工智能大会(WAIC)官方重点配套活动 [2] - 会议旨在锚定产业核心矛盾,串联全赛道力量,共同探寻算力产业的重构路径 [2] - WAIC是全球最具影响力的AI行业平台之一,2026年大会由图灵奖得主姚期智担任首次设立的WAIC Academic学术大会主席 [4] 参会企业阵容与产业覆盖 - 参会企业阵容全面覆盖国产算力全产业链关键环节,形成多元格局 [9] - 头部云服务商代表:百度智能云,拥有昆仑芯自研算力底座和大规模训推一体云平台,在万卡集群调度和AI算力规模化落地领域经验深厚 [9] - 智算基建龙头代表:中科曙光,作为国家级智算基建龙头,是国内算力基础设施建设与算力网络布局的核心力量 [9] - 算力芯片端代表包括壁仞科技、云天励飞(通用AI芯片),以及为旌科技、迈特芯、微纳核芯、硅芯科技、翼华科技、亿铸科技(存算一体、专用场景算力、芯片底层互连等细分赛道) [10] - 会议覆盖了从通用算力到专用算力,从硬件芯片到集群调度再到芯片底层互连的核心赛道 [10] 会议特色与产业价值 - 获得北京、上海、湖南、江苏等相关政府部门代表支持,旨在为本土智算中心建设及政务AI应用场景寻求解决方案,为芯片与算力企业提供政企对话窗口 [9] - 旨在助力国产算力厂商实现从“技术可用”到“市场落地”的关键跨越 [9] - 打破上下游信息差和赛道间视角壁垒,让算力供给侧的技术突破能直接对接需求侧的落地场景 [10] - 观众生态覆盖“模型—终端—基建—资本”四维产业环节,包括百度、阿里巴巴、字节跳动等大模型平台,地平线、中科创达等智能硬件企业,工业富联、科华数据等智算基建商,以及华登国际、云岫资本等资本与研究机构 [16] - 配套长效内容沉淀机制,包括会前前瞻、会中直播、会后实录及深度报告,形成长期开放的算力产业资料库 [17] 传播与影响力 - 由观察者网与半导体行业观察联合出品,构建“大众舆论破圈+垂直圈层深耕”的全域传播体系 [16] - 观察者网拥有千万级直播受众矩阵,可推动产业话题打破圈层壁垒 [16] - 半导体行业观察作为权威芯片垂直媒体,粉丝量突破百万,深耕算力、半导体赛道多年,沉淀超5000家企业资源 [16] - 形成“主办方+参会企业+行业媒体”三位一体的传播矩阵,实现行业影响力持续放大 [16]
预测:台积电上调资本支出至780亿美元!
半导体行业观察· 2026-07-05 10:39
台积电资本支出预测上调 - 高盛将台积电2027年资本支出预测从700亿美元上调至780亿美元,2028年从740亿美元调整至820亿美元 [3] - 台积电2026年资本支出预测维持560亿美元不变 [3] - 资本支出上调主要因人工智能基础设施需求持续增长,以及更多洁净室在2027年后建成投产,公司将扩大对前端和后端产能的投资 [3] 先进制程产能与需求展望 - 预计到2027年底,台积电3纳米和2纳米工艺的月晶圆产能将分别达到20万片和14万片 [4] - 2纳米工艺第一年的晶圆产量比3纳米工艺高出45%,普及速度加快 [4] - 新竹Fab 20和高雄Fab 22将于2026年快速扩建,以支持先进产能 [4] - 2纳米工艺已于今年开始全面量产 [4] 技术节点销售占比与增长预测 - 预计2纳米和A16工艺产能的复合年增长率在2026年至2028年间将达到70% [4] - 预计5纳米及更小工艺在晶圆总销售额中的份额在2026年至2028年将分别达到69%、75%和82% [4] 先进封装(CoWoS)产能扩张 - CoWoS年产能预计在2026年至2028年将分别达到127.5万张、273万张和348万张 [4] - 最新预测值超过了此前预测的127.5万张、249万张和315万张 [4] 市场驱动因素与公司战略 - 人工智能加速器和服务器CPU推动的增长势头在过去一个季度超出预期,预计2027年需求增长将更加强劲 [3] - 台积电将大幅增加对先进工艺的资本投入,并加快产能建设,以满足客户需求 [3] - 未来两年销售额预计超出市场预期,主要得益于产能扩张超出预期,以及紧急订单需求和生产效率提高带来的额外效益 [3]
苹果A20芯片,参数曝光
半导体行业观察· 2026-07-05 10:39
苹果A20系列芯片技术升级 - 即将推出的iPhone 18 Pro和Pro Max将搭载A20 Pro芯片,该芯片将放弃已使用约13年的64位内存带宽,转而采用96位LPDDR6内存 [1][2] - A20 Pro芯片将采用96位8533 LPDDR5X,总带宽为102GB/s [4] - 96位LPDDR5X内存比64位内存“大15-20%”,而LPDDR6内存可以在与64位LPDDR5X内存相同尺寸的情况下提供96位容量 [6] 芯片制程与性能 - A20和A20 Pro将是苹果首款采用台积电2nm(N2)制程工艺的芯片,而A19系列是最后一代采用3nm工艺的芯片 [8] - 与台积电3nm N3E节点相比,2nm N2工艺预计在相同功耗下性能提升10-15%,在相同性能水平下功耗降低25-30%,在功率和性能相同的情况下晶体管密度提高15%或更多 [10][12] - 台积电2nm晶圆产能已全部售罄并满负荷运转,苹果公司抢占了超过一半的初始产能 [10] 芯片设计与封装 - A20内部代号为“婆罗洲”(Borneo),A20 Pro代号为“婆罗洲至尊版”(Borneo Ultra) [11] - A20和A20 Pro预计将采用6核CPU设计,包括两个性能核心和四个能效核心 [15] - 芯片封装将从集成扇出型封装(inFO)转向晶圆级多芯片模块封装(WMCM),DRAM模块将与芯片分离,并配备更大的神经网络引擎以提升设备端AI性能 [14] - A20 Pro还将采用SHPMIM电容,其电容密度是普通电容的两倍,并配备更大的均热板以增强散热能力 [17] 产品规划与成本 - 基础款iPhone 18将搭载A20芯片,而iPhone 18 Pro、iPhone 18 Pro Max以及苹果首款可折叠iPhone将搭载A20 Pro芯片 [11] - 预计2026年苹果将推出三款不同版本的A20和A20 Pro芯片组 [17] - A20和A20 Pro的预计制造成本高达每台设备280美元 [18] - 苹果的DRAM相关成本预计将从iPhone 17 Pro系列的每部39美元飙升至iPhone 18 Pro和Pro Max的每部145美元,此估算基于12GB LPDDR5X内存假设,若采用LPDDR6成本将进一步上升 [7] 技术升级背景与影响 - 向96位RAM过渡符合苹果对改进后的Siri和Apple Intelligence框架(结合设备端和云端AI模型)的重视 [6] - 内存成本上升解释了苹果在闪存存储上采取的成本削减策略,例如在1TB和2TB版本中采用速度更慢的QLC NAND闪存,而非TLC NAND闪存 [6][7]
130亿美元!印度半导体计划2.0启动
半导体行业观察· 2026-07-05 10:39
印度半导体计划 (ISM 2.0) 第二阶段拨款获批 - 印度政府支出财务委员会已批准为印度半导体计划第二阶段拨款1.25万亿卢比(约130亿美元)[1] - 该提案将提交联邦内阁审议[2] 计划预算与范围 - 第二阶段预算较第一阶段大幅增加,第一阶段政府拨款为7600亿卢比(约80亿美元)[2] - ISM 2.0致力于加强整个半导体价值链,包括芯片设计、制造和封装[2] - 计划可能更注重对化合物半导体企业及芯片制造与封装所需原材料(如气体、锭块)制造商的激励[2] 计划具体举措与目标 - 作为132亿美元计划的一部分,印度将启动新的半导体研究和培训中心(SAMARTH),旨在建立自力更生的芯片产业并减少对海外供应链的依赖[2] - SAMARTH中心位于古吉拉特邦的印度理工学院,将支持研究、人才培养和产业合作,印度政府与合作部门将共同投资1990万美元建设该设施[2] - 政府目标不仅是建立工厂,而是构建涵盖设计、机器制造、物流的完整半导体生态系统[2][3] 第一阶段进展与现有投资 - 第一阶段已批准12个半导体制造项目,涉及约173亿美元投资,包括1个芯片制造厂、2个化合物制造厂和9个封装厂[4] - 设计关联激励计划支持24个项目,105家公司已获得先进芯片设计工具,并完成23个芯片的流片[4] - 印度联邦内阁正通过该倡议向古吉拉特邦的两个半导体项目投资约4.17亿美元[4] 供应链与产业动态 - 工业气体供应商INOX Air Products为美光在古吉拉特邦投资27.5亿美元的半导体工厂启动提供支持,并投资5800万美元开发电子特种气体中心[4] - 除古吉拉特邦外,塔塔电子正在建设一座半导体工厂,预计将于12月开始初步生产芯片[4]
被动元件涨价潮
半导体行业观察· 2026-07-05 10:39
文章核心观点 - AI基础设施驱动了被动元件需求增长,但不同元件类别(如电容、电感、电阻)的供需状况、涨价原因及受益厂商存在显著差异,并非所有产品都因缺货而涨价,也并非所有涨价都能带来更好的获利 [1][2] - 多层陶瓷电容(MLCC)是AI服务器需求增长中的核心元件,用量是传统服务器的3到5倍,其供应缺口为台系厂商创造了切入机会 [6] - 国巨凭借其在钽质电容市场的领先地位(市占率近半)和一站式产品组合,在AI驱动的被动元件浪潮中拥有强大的议价实力和不可替代性 [9] AI驱动下的被动元件市场概况 - 过去3个月,国巨、华新科、禾伸堂、信昌电、立隆电等被动元件公司股价呈现至少两倍的涨幅,反映资本市场看好AI基础设施驱动的需求 [2] - 摩根士丹利在约4个月内将国巨目标价从305元大幅上调至1515元,国巨股价于6月18日突破千元大关 [2] - 业内人士乐观看待未来至少两年的需求前景 [2] 不同被动元件的涨价驱动与厂商机会 - **电感与电阻**:涨价主要因银、铝等金属原材料成本上涨,毛利率未必能同步提升 [3] - **跨电感稳压器(TLVR)**:用于AI服务器,因未使用太多贵金属而利润较好,主要供应商为台达电旗下的乾坤,台庆科、三集瑞-KY、新聿科也受益于供应缺口积极布局 [4][6] - **多层陶瓷电容(MLCC)**:是AI服务器需求的主角,用量为传统服务器的3到5倍,需高耐热且小型化 [6] - **钽质电容**:由国巨旗下的KEMET主导,市占率近半,因元件特性最佳而难以被MLCC完全取代,使国巨拥有强势报价能力 [9] 台系厂商的竞争格局与机会 - **MLCC供应缺口**:日韩厂商(如村田、太阳诱电、三星电机)将产能优先转向AI服务器,导致消费电子MLCC供应出现缺口,华新科等台厂直接受惠 [6] - **切入AI服务器主板**:日韩厂商专注于利润更高的核心部位,为主板周边电容元件留下空间,禾伸堂和信昌电的MLCC已切入AI服务器主机板 [7] - **验证机会**:当前MLCC缺口比4月更大,AI服务器客户对验证台厂元件持更开放态度,即使台厂产品良率与价格曾有劣势,但因供应紧张而获得测试机会 [7] 龙头厂商国巨的竞争优势 - **产品组合与议价力**:拥有钽质电容、MLCC、电阻、电感等丰富产品组合,凭借钽质电容的难以替代性延伸出强大议价实力 [9] - **价格上调**:摩根士丹利报告指出,国巨下半年产品平均报价可望上调30%以上,电阻产品价格也将上调 [9] - **商业模式**:一站式购足服务模式有助于其在景气周期中维持强大竞争力 [9]
三星晶圆代工未来路线,最新披露!
半导体行业观察· 2026-07-05 10:39
三星晶圆代工客户项目进展 - 公司正与知名客户合作开发2纳米工艺技术,仅用八个月便与一家专注于汽车和物理人工智能的公司完成开发,被广泛解读为与特斯拉合作[4] - 韩国最大的人工智能公司即将开始采用4纳米工艺量产芯片,该芯片集成了12个芯片单元、小型去耦电容、高带宽内存和通用芯片互连高速接口[4] - 一款为GPU公司设计的语言处理单元已投入量产,该芯片包含超过4GB的SRAM,面积达723平方毫米,并通过定制化SRAM设计实现了高良率,业内人士认为客户可能是英伟达旗下的Groq公司[4][5] 生态系统合作伙伴动态 - 客户Rebellions表示三星的4纳米工艺提供了“竞争对手无法比拟的封装后性能”,其第二代神经处理单元REBEL 100已完成封装后功能验证,正在进行稳定性测试[5] - 设计解决方案合作伙伴SemiFive正在设计一款800平方毫米的语言处理单元,集成了四个堆叠的DRAM器件[5] - 合作伙伴Gaonchips正在执行一个涵盖从设计到封装的2纳米人工智能高性能计算大芯片交钥匙工程,并得到了三星晶圆代工团队的大力支持[5] - 合作伙伴ADTechnology正与多家主权人工智能开发商、超大规模数据中心运营商和主要电信运营商就联合开发的2纳米CPU项目ADP 620进行深入探讨,该项目预计将于明年第二季度完成流片[6] - 合作伙伴CoAsia Nexell专注于高带宽内存相关技术研发,正在开发结合2.5D和3D技术的封装结构用于下一代高带宽内存,并研究Quilt封装技术以期在2030年前克服光刻胶尺寸限制[6] 三星晶圆代工制程技术路线图 - 公司计划于2029年开始量产1.4纳米制程,随后于2030年推出增强型1.4+制程[7] - 2纳米技术路线图将依次发展为2纳米、2P、2P+和2X,其中2P+制程预计将于2027年至2028年间实现量产[7]