Workflow
半导体芯闻
icon
搜索文档
英伟达,挣翻了
半导体芯闻· 2026-02-26 18:22
核心观点 - 公司季度及年度业绩全面超越华尔街预期,数据中心业务是核心增长引擎,人工智能计算投资热潮持续推动其营收和利润创下新高 [1][4] - 公司管理层对未来增长充满信心,预计营收将持续增长,并强调了“计算能力即收入”的逻辑,认为人工智能代币生成将驱动对计算资源的长期需求 [5][9][11] - 公司面临供应链限制、地缘政治不确定性及竞争加剧等挑战,但通过新产品发布、供应链多元化及战略投资来巩固其行业领导地位 [3][4][7][8] 财务业绩表现 - **整体业绩超预期**:当季每股收益为1.62美元,高于预期的1.53美元;当季总营收为681.3亿美元,高于预测的662亿美元;年度营收创历史新高,达2159亿美元 [1] - **利润创纪录**:本财年总利润高达1200亿美元 [1] - **持续增长预期**:公司预计2月至4月季度营收将增长至780亿美元(上下浮动2%),并预计2026年全年营收将持续增长,超过此前预测的2026年底达到5000亿美元的目标 [5] 各业务部门表现 - **数据中心业务**:是公司绝大部分收入的来源,当季收入同比增长75%至623亿美元,环比增长22%;其中网络组件销售额达109.8亿美元,同比增长263% [1][2] - **游戏业务**:营收同比增长47%至37亿美元,但环比下降13%;受内存供应限制影响,公司今年可能不会推出新的游戏GPU [2][9] - **专业可视化业务**:营收为13.2亿美元,同比增长159%,高于预期的7.554亿美元 [3] - **汽车业务**:季度销售额为6.04亿美元,同比增长6%,但低于分析师预期的6.548亿美元 [2] 增长驱动与行业动态 - **人工智能投资热潮**:科技行业对人工智能基础设施的巨额投资是主要驱动力,大型科技公司公布了2026年的巨额资本支出计划,云服务提供商准备在数据中心建设上投入数千亿美元 [1][4] - **客户结构**:超大规模数据中心占数据中心收入的50%以上;前五大云提供商贡献了数据中心收入的一半左右,另一半来自日益多元化的客户,包括AI初创公司、企业和主权政府 [2][11] - **计算即收入逻辑**:管理层认为,企业为生成人工智能代币需要持续投资计算能力,这直接转化为公司的收入增长 [9][11] 产品与技术进展 - **新一代产品**:下一代机架式存储系统Vera Rubin(Grace Blackwell继任者)预计每瓦性能将提高10倍,首批样品已交付客户,计划2026年下半年量产发货 [4][5] - **技术突破**:NVLink网络技术及Spectrum-X以太网交换机需求强劲;推理性能的提升被视为直接收益来源 [2][9] - **供应链扩展**:正在将供应链从集中的亚洲地区扩展到美国和拉丁美洲,例如在亚利桑那州新建芯片制造厂,部分系统在墨西哥富士康工厂组装 [4] 战略投资与生态系统 - **战略投资规模**:年内向私营企业和基础设施基金投资了175亿美元,主要用于支持早期创业公司 [3] - **投资逻辑**:投资旨在构建生态系统,确保从大型语言模型到机器人技术等应用都构建在公司平台上,投资对象(如Anthropic、OpenAI)同时也是其客户 [10] - **重点交易**:与OpenAI的1000亿美元投资交易告吹,转而计划投资300亿美元,双方正努力接近达成合作协议 [5] 面临的挑战与风险 - **供应链限制**:全球内存短缺,预计供应限制将在2027财年第一季度及以后对游戏业务构成不利影响;最新芯片架构的供应仍然紧张 [3][6] - **地缘政治影响**:尽管美国政府批准向中国客户少量出口H200芯片,但公司展望中未计入来自中国的任何数据中心收入,且面临来自中国本土芯片制造商日益激烈的竞争 [7][8] - **市场竞争**:中国AI芯片“四小龙”中的三家已上市,另一家正在筹备,这些竞争对手在近期IPO推动下可能长期颠覆全球AI行业格局 [8] 管理层观点与展望 - **对AI行业信心**:不担心人工智能公司后劲不足或资金短缺,认为行业已到达智能体人工智能的转折点 [9] - **增长可持续性**:坚信资本支出热潮不会消失,因为“计算驱动收入”,人工智能代币生成是计算的未来,公司将持续构建和扩展相关能力 [11] - **业务多元化**:需求正从大型科技公司向更广泛的客户群体扩散,这支持了收入的多元化 [11]
三星存储,涨价100%?
半导体芯闻· 2026-02-26 18:22
文章核心观点 - 三星电子Galaxy S26系列手机生产启动,其DRAM芯片供应结构为三星DS部门与美光各占50%,但面临来自这两家供应商的显著价格压力,预计将导致手机成本上升并影响移动体验(MX)部门的盈利能力[1][2][3] - 移动DRAM市场供应紧张,主要供应商三星DS和美光均计划大幅提价,其中三星DS对苹果的LPDDR5X芯片价格已翻倍,美光也计划实施大幅涨价,这加剧了智能手机制造商的成本压力[1][4][5] - 三星MX部门试图通过提高Galaxy S26售价、增加自研Exynos 2600处理器的采用率来抵消成本,但在内存价格飙升的背景下,这些措施可能不足以完全缓解盈利压力[3] Galaxy S26系列DRAM供应与生产情况 - 三星MX部门正在生产首批Galaxy S26系列手机,其DRAM芯片由三星DS部门和美光各供应50%[1] - 此次供应的LPDDR5X内存基于1b工艺,美光曾提交更先进的1gamma (γ·1c)工艺样品,但因工艺不成熟而被推迟采用,首批产品通过改进前代产品电路线宽,使生产效率提高了15%[3] - 前代Galaxy S25系列的DRAM供应结构最初全部采用美光,后调整为三星DS部门约占60%,美光约占40%,此次S26系列回归50/50的平衡结构[2] 移动DRAM市场价格与谈判动态 - 三星DS部门已将对苹果iPhone 17系列供应的LPDDR5X内存价格提高100%(即翻倍),最初策略是提价约60%,但因苹果迅速接受而最终定价更高[4] - 美光也准备宣布对MX部门的内存提价,鉴于其产能有限,预计将在三大内存厂商中实施幅度最大的移动DRAM价格上涨[5] - 尽管三星DS和美光对MX部门的涨价幅度低于对竞争对手(如苹果)的涨幅,但价格仍全面上涨[1] - 三星DS部门与MX部门的交易采用季度合约而非长期协议,以实现利润最大化[4] 供应链关系与行业竞争态势 - 三星DS部门的产品质量已显著改善,大约两年前其消费级DRAM偶有召回问题,但随着设计裕度提高,近期质量改善,增强了在移动DRAM领域的竞争力[2] - 美光DRAM曾在性能和良率上优于三星DS产品,这影响了Galaxy S25系列的初期供应结构[2] - 由于通用内存短缺,确保供应成为MX部门的优先任务,DS部门在去年第四季度与美光进行了激烈谈判,才达成初期各供50%的协议[2] - 行业观点认为,即使MX部门因供应短缺减少采购,DS部门和美光也不会感到遗憾,因为其他客户需求充足[5] 三星MX部门的应对策略与影响 - 为应对成本压力,三星MX部门计划提高Galaxy S26系列的价格,并增加约30%的自研应用处理器Exynos 2600的采用率[3] - 专家认为,鉴于内存价格飙升,上述措施可能不足以完全缓解MX部门的盈利压力[3] - 三星电子总裁(DX部门负责人)与美光首席执行官在CES 2026期间举行了紧急会议,讨论内存供需问题[5]
日本继续豪赌芯片
半导体芯闻· 2026-02-26 18:22
日本政府推动半导体产业集群计划 - 日本政府为提升AI用最尖端半导体产业竞争力,计划培育设计、生产设备、材料等领域的企业[1] - 计划在日本国内设立3个基地,配备昂贵的设计软件与开发设备,供初创企业及大学使用[1] - 以台积电和Rapidus为核心,完善国内生产体系,并强调与海外企业及研究机构合作的重要性[1] 三大基地的具体规划与目标 - 计划于2026年秋季在东京都内开设面向半导体设计的基地,重点关注“物理AI”等用途,配备最尖端自动设计工具和计算服务器,并有专业技术人员支持[1] - 计划在北海道千岁市Rapidus工厂附近开设设备与材料基地,目标2029年度启动,将引进荷兰ASML生产的最新款极紫外光刻设备[1] - 计划建设“化合物半导体”试制基地,采用氮化镓等材料以实现高性能,设备可用于测试各类材料,应用领域包括AI数据中心服务器、纯电动汽车和6G[1] 资金投入与政府支持 - 建设基地将使用政府预算中已确定的1306亿日元以及产业技术综合研究所的资金,旨在让企业与研究机构能以低廉价格使用设备[2] - 政府承担高昂研发成本,例如半导体设计工具需耗资数十亿至数百亿日元,一台最新光刻设备高达数百亿日元,为民间技术革新打下基础[2] - 日本政府已投入巨额补贴推进引进台积电、扶持Rapidus等工作,国内最尖端半导体量产能力正在逐步完善[2] 产业现状与战略目标 - 日本国内生产的最尖端半导体的主要客户预计仍将是海外企业[2] - AI半导体设计以美国英伟达等企业为主,日本企业起步较晚,日本企业具备优势的生产设备及材料领域也因中国企业崛起导致份额缩小[2] - 日本政府希望通过建设基地,培育有望成为台积电、Rapidus合作伙伴的企业,若能诞生可设计AI半导体的本土企业或培育出尖端设备与材料厂商,有望扩大市场份额[2] 历史教训与发展路径 - 过去日本半导体产业衰退的原因之一被认为是过度坚持自给自足[3] - 突破企业与国界限制、强化合作被视为提升国际竞争力的必要条件[3]
日本芯片设备,销售再创新高
半导体芯闻· 2026-02-26 18:22
日本半导体制造设备行业销售表现 - 2026年1月份日本制芯片设备销售额为4,275.08亿日圆,同比增长2.6%,创下历年同月历史新高纪录,为单月历史第5高水准 [1] - 月销售额连续第27个月高于3,000亿日圆,连续第15个月高于4,000亿日圆 [1] - 2025年日本制芯片设备销售额年增14%至5兆585.08亿日圆,连续第2年增长,年销售额史上首度冲破5兆日圆大关,连续第2年创下历史新高纪录 [1] - 日本芯片设备全球市占率达3成,仅次于美国位居全球第2大 [1] 行业增长驱动因素与前景预测 - 因AI伺服器用半导体需求急速扩大,带动先进逻辑和DRAM投资大幅增加,2026年全球芯片前段制程制造设备市场规模预估将成长15%以上 [2] - 在DRAM领域,除了HBM外,通用型DRAM投资激增 [2] - 因台湾晶圆代工厂的2奈米投资全面展开、加上以HBM为中心的DRAM投资稳健,2025年度日本制芯片设备销售额预估上修至4兆9,111亿日圆,将较2024年度增加3.0% [2] - 2026年度日本芯片设备销售额预估上修至5兆5,004亿日圆,将年增12.0%,年度别销售额将史上首度冲破5兆日圆大关 [3] 主要公司动态与业绩指引 - 日本芯片设备巨擘TEL指出,随着AI伺服器用半导体需求扩大,带动先进逻辑和DRAM投资增加 [2] - 日本晶圆切割机大厂DISCO预估,2026年1-3月出货额将年增26%至1,169亿日圆,季度别出货额将续创历史新高纪录 [2]
台积电市值,突破两万亿,全球第六
半导体芯闻· 2026-02-25 18:11
台积电市值突破里程碑 - ADR于5月24日大涨4.25%,收于385.75美元,市值正式突破2万亿美元,成为美股史上第8家、台湾企业第1家达到此成就的公司 [1] - 台积电全球企业市值最新排名升至第六位,仅次于英伟达、苹果、Alphabet、微软、亚马逊 [1] - 台积电在台湾的股价同日大涨,冲上2000元新台币,收于2015元,市值突破52.2万亿新台币,是其本土GDP总额的二倍 [1] 市场表现与投资者关注 - 台积电ADR过去三个月的日平均成交金额约为41亿美元,是其台湾股票日平均成交金额18.6亿美元的约2.2倍,显示国外机构投资人关注度更高 [2] - 股价及市值创新高凸显了AI大趋势,各国机构投资人认识到公司在全球半导体产业的重要性,吸引外资加码买进ADR [1] 行业地位与AI浪潮机遇 - 在全球AI发展趋势下,几乎所有芯片都以台积电为首选代工厂,公司被认为是这波AI大浪潮的最大赢家 [2] - 尽管英伟达是全球市值最大的AI芯片公司,但随着更多竞争者以ASIC分食其GPU市场,这些芯片最终仍需依赖台积电代工,从而提升了公司的受关注度 [2] 资本支出与供应链影响 - 为满足客户对AI及高效能运算的需求,公司计划未来三到五年在台湾、美国、日本及德国建造21座晶圆厂及先进封装厂 [2] - 自今年起未来三年,公司每年的资本支出都将超过500亿美元,为包括材料、化学品、设备和周边供应商在内的供应链带来强大活水 [2] - 随着台积电股价与市值创新高,其供应链也将受益 [2]
英伟达H200:一颗没拿到
半导体芯闻· 2026-02-25 18:11
文章核心观点 - 尽管美国政府在两个月前有条件批准了英伟达向中国销售H200 AI芯片,但截至目前,英伟达尚未向中国出售任何H200芯片 [1] - 美国商务部官员证实,美国正在加强打击用于人工智能的先进半导体走私活动,并将其列为执法工作的首要优先事项之一 [1][2] 美国对华AI芯片出口管制现状 - 美国商务部负责出口执法的助理部长皮特斯向国会证实,据其了解,目前还没有任何H200芯片获准销往中国 [1] - 该评论为外界提供了对美国商务部工业暨安全局运作状况的罕见了解,该局负责监管敏感技术出口的批准流程 [1] - 前总统特朗普政府在1月批准英伟达向中国销售H200芯片,但设有条件,此举引发了美国两党国会议员及前官员的批评 [2] 美国政府的政策立场与行动 - 由白宫AI事务负责人塞克斯领导的政府认为,向中国运送先进AI芯片有助于抑制中国竞争对手(包括受严厉制裁的华为)全力追赶英伟达与AMD等公司最先进芯片设计的进程 [2] - 美国商务部官员皮特斯确认,芯片走私活动“确实存在”且“正在发生”,美国正在积极处理此问题,并将其列为执法工作的首要优先事项之一 [1][2] 市场与公司动态 - 皮特斯作证的时间点恰逢投资者关注英伟达即将公布的财报,市场预期英伟达可能会在财报中说明其重返中国这一高利润市场的进展 [1] - 对于相关置评请求,中国驻华盛顿大使馆与英伟达均尚未作出回应 [2]
你想不到的AI芯片大战
半导体芯闻· 2026-02-25 18:11
谷歌与英伟达的竞合关系 - 谷歌长期以来是英伟达人工智能芯片的最大客户之一,其首席执行官在过去三年的12次季度财报电话会议中有10次明确提到了对英伟达产品的使用[1] - 谷歌发布的Gemini 3大型语言模型在人工智能基准测试中表现出色,将公司推上人工智能领域顶峰,且该模型完全使用谷歌自主研发的TPU芯片进行训练[1] - 谷歌在Gemini 3发布后,开始向包括Meta Platforms在内的其他公司兜售其TPU芯片,这使其成为英伟达的直接竞争对手[1] 谷歌在芯片领域的扩张与挑战 - 谷歌试图向Meta销售TPU芯片,但Meta最终与英伟达签署了一项新协议,该协议包括将英伟达的CPU芯片大规模部署在不搭载该公司GPU的传统服务器设备中[2] - 谷歌加大对数据中心合作伙伴的资金支持,包括洽谈向一家名为Fluidstack的云计算初创公司投资约1亿美元,此举借鉴了英伟达投资新型云运营商的策略[2] - 谷歌面临芯片生产的重大挑战,英伟达已占据台积电顶级芯片生产线的绝大部分产能和必要零部件,并优先采购人工智能系统所需的专用内存[3] 行业竞争格局 - 大型科技公司在某些领域合作,在另一些领域竞争,“亦敌亦友”的关系在科技领域并非新鲜事[1] - 英伟达的芯片供不应求,即使是财力雄厚的谷歌也必须与其他资金充裕的科技巨头竞争才能获得这些芯片组件[1] - 谷歌是人工智能领域的巨头,但要成为人工智能芯片领域的巨头仍然面临巨大困难[3]
芯片行业,加速并购
半导体芯闻· 2026-02-25 18:11
行业前景与增长动力 - 半导体行业在经历动荡后,于2026年初重拾增长势头,人工智能是主要增长催化剂,推动对先进逻辑、存储器和数据中心基础设施的投资 [1] - 德勤预测2026年全球芯片销售额将达到9750亿美元,同比增长率将从22%加速至26% [2] - 人工智能相关半导体市场预计约5000亿美元,将超过行业总收入的一半,但这些芯片销量仅占总出货量的不到0.2%(2025年总出货1.05万亿颗,其中仅2000万颗用于生成式AI) [2] - 消费电子产品市场低迷开始消退,有助于稳定供需平衡,汽车电气化和先进互联技术是长期增长亮点 [4] 市场结构变化与风险 - 行业增长高度集中,主要芯片制造商转向高利润的AI芯片,导致非AI半导体买家处境艰难,面临库存水平下降和价格上涨 [2] - 内存市场收入预计在2026年达到2000亿美元,但增长严重依赖面向AI数据中心的高价产品(如HBM),DDR4/DDR5价格预计将进一步上涨 [3] - “全力投入AI”的策略存在风险,若商业化进程受阻或数据中心建设受限,整个行业可能遭受损失,许多非AI领域增长可能放缓甚至下滑 [3] - AI需求推动了数据中心建设及配套网络、电力生态系统的投资,在先进封装和电源/散热管理等领域的资本支出将持续增长 [3] 行业整合与并购活动 - 激烈的市场竞争正推动主要厂商进行战略收购,德州仪器收购Silicon Labs是行业并购浪潮的最新案例 [1] - 德州仪器计划以每股231美元现金和约70亿美元新增债务收购Silicon Labs,交易预计2027年初完成,将新增1200种产品以支持无线标准 [5][6] - 收购使德州仪器获得难以快速重建的软件、固件和应用程序,并计划将组装测试环节纳入自有工厂,预计交易后三年内每年产生超过4.5亿美元的生产与运营协同效益 [6] - 此类收购体现了AI主导下的市场整合趋势,旨在垂直整合并精简产品线,但可能降低供应商多样性,增加企业面对颠覆性创新时的风险 [6] 对供应链与采购的影响 - 行业“正常化”并非回到过去周期,分配风险和价格波动将伴随AI发展而持续 [4] - 供应商数量日益减少的担忧加剧,严谨的采购策略比以往更重要,需尽早评估替代方案、跟踪产品生命周期并保持跨地域和渠道的灵活性 [1][7]
三星股价,狂飙200%
半导体芯闻· 2026-02-25 18:11
三星电子股价表现与市场动能 - 三星电子股价攀升至创纪录的200,000韩元,为过去六个月的强劲涨势画下句点,期间累计涨幅已接近200% [1] - 股价上涨主要受记忆体芯片需求激增驱动,公司作为全球最大记忆体生产商之一,正日益受益于人工智慧基础设施建设 [1] AI驱动下的记忆体需求与公司业务 - 伺服器已成为记忆体需求的主要驱动力,目前三星约70%的记忆体出货量与AI伺服器应用相关 [1] - 高阶策略获得市场认可,公司被视为正在重新取得技术优势,计划于2026年下半年开始为NVIDIA的Vera Rubin GPU供应HBM4产品 [1] - HBM4产品预计将提供每秒11.7 gigabits的速度,使公司在高效能记忆体领域更具竞争力 [1] 有利的宏观需求背景 - Google、Microsoft、Amazon和Meta合计的2026年资本支出预计将年增76%,反映出对AI基础设施的持续积极投资 [1] - 由于云端需求仍超过供应,超大规模业者几乎没有延迟支出的诱因,这种动态应能让与伺服器相关的记忆体需求在年底前保持高档 [1] 资金流向与市场定位 - 过去一周,iShares MSCI南韩ETF录得约10亿美元的资金流入,创下十年来新高 [2] - 南韩股市被定位为唯一同时提供获利成长(年增90%)和估值优势(本益比10倍)的新兴市场 [2] 半导体获利预期与技术进展 - 半导体获利预计将推动大部分获利扩张,三星电子和其他芯片制造商合计的2026年营业利益预计将年增224万亿韩元,占KOSPI总营业利益预期增加267万亿韩元的84% [2] - 在技术方面,三星的10奈米级第六代DRAM(称为1c)良率已超过80%,显示已进入稳定量产阶段 [2] - 由于1c制程是下一代HBM4的基础,这项里程碑预计将在AI记忆体需求持续加速之际,同时支撑竞争力和获利能力 [2]
全球首颗1.6nm芯片,即将发布?
半导体芯闻· 2026-02-25 18:11
文章核心观点 - 英伟达计划在GTC 2026大会上发布多款足以“震惊世界”的下一代AI芯片和技术,旨在突破当前AI芯片面临的内存带宽、互连功耗和推理效率三大物理瓶颈,巩固其市场领导地位并扩展生态系统 [1][5][7][8][9] 下一代AI芯片Feynman - 英伟达下一代数据中心GPU代号为Feynman,预计将于2028年发布,采用台积电1纳米级别(16A工艺)工艺制造 [1] - 公司可能将部分Feynman GPU的生产外包给英特尔,双方并就封装和代工制造合作进行磋商 [2] GTC 2026大会预期发布 - 大会将于3月16日至19日在圣何塞举行,预计发布内容包括下一代AI芯片、新型PC芯片、物理AI软件及数字孪生技术 [1] - 首席执行官黄仁勋预告将发布“多款前所未见的芯片”,暗示不止一款产品 [5] 内存合作伙伴动态 - 三星电子将在GTC上展示其第六代高带宽内存HBM4的性能,该产品已量产并将与英伟达Rubin GPU配合使用,同时还将分享下一代HBM4E与英伟达GPU的兼容性分析 [2] - SK海力士也将展示HBM4,并演讲其如何提升大语言模型效率,公司已开始量产用于Rubin GPU的HBM4芯片,预计2026年将供应英伟达所需HBM4总容量的三分之二左右 [2][3] - 黄仁勋与SK海力士工程师共进晚餐的时机,强烈暗示存储器逻辑集成对未来发展至关重要 [6] AI芯片面临的技术瓶颈 - **内存带宽差距**:GPU计算能力每代提升3到5倍,而内存带宽仅增长2到3倍,形成“内存墙”,导致GPU可能因数据供给不足而闲置 [7] - **互连电源限制**:在假想的百万GPU集群中,仅可插拔收发器就会消耗数百兆瓦功率,铜互连的物理限制正成为AI数据中心扩展的瓶颈 [8] - **LLM推理的结构性低效**:LLM推理的预填充(计算密集型)和解码(内存带宽密集型)阶段对硬件要求不同,在同一GPU上运行会相互干扰,分开处理可提升2.35倍吞吐量 [9] 潜在技术方案与产品路线 - **方案一:Rubin Ultra**:计划于2027年下半年推出,将四个GPU计算芯片集成在一个封装内,配备16个HBM4E显存堆栈(1TB),在NVFP4模式下性能可达100 PFLOPS,功耗3600W [10] - Rubin Ultra NVL576机架(代号“Kyber”)由144个此类封装组成,总计576个计算芯片,可提供15 ExaFLOPS的FP4运算能力,相当于GB300 NVL72性能的14倍 [12] - GTC 2026可能会公布Rubin Ultra的具体生产时间表及Kyber机架细节 [13] - **方案二:全硅光子堆栈**:英伟达已发布基于硅光子技术的网络交换机Quantum-X和Spectrum-X,GTC 2026可能会公布Rubin Ultra时代的NVLink光互连路线图,实现GPU间互连从铜缆向光纤过渡 [14][15][19] - Quantum-X800交换机ASIC采用台积电4N工艺,拥有1070亿个晶体管,144个800 Gbps端口,总带宽115 Tb/s,与可插拔设备相比能效提高3.5倍 [20] - **方案三:Rubin CPX系统**:这是一款专用于推理的GPU,采用GDDR7内存而非HBM,可将内存成本降低约五分之一,其密集FP4计算能力约为20 PFLOPS,是R200的60% [21][23] - Vera Rubin NVL144 CPX机架包含72个R200 GPU封装和144个CPX GPU,单机架提供8 ExaFLOPS NVFP4算力,AI推理性能较GB300 NVL72提升7.5倍 [24] - **更宏观的推理架构**:Rubin CPX与英伟达收购Groq LPU的战略,预示着向异构推理架构发展,其中不同芯片专门处理推理的不同阶段 [25][27] 长期技术方向:3D IC堆叠 - 当前2.5D CoWoS封装存在封装尺寸大、中介层成本高、GPU与HBM物理距离远等问题 [30] - 未来方向是将DRAM(HBM)垂直堆叠在GPU芯片上方(3D IC),可显著降低延迟、提高带宽和能效,SK海力士计划从HBM5代(2028-2029年)开始引入此架构,并与英伟达等公司洽谈集成设计 [31] - 实现3D IC的主要障碍包括散热挑战(DRAM耐热性远低于GPU)以及组装后的良率问题(GPU良率85%与8个HBM堆栈良率95%组合,总良率仅约56%) [32] - GTC 2026可能会正式宣布英伟达与SK海力士联合开发3D芯片 [33] - 技术演进路线图显示:HBM4/HBM4E(2026-2027年)仍为2.5D,是3D的“准备阶段”;HBM5(2028-2029年)为首个3D HBM尝试,与Feynman时间表一致;HBM6(2030年及以后)3D IC走向主流 [36]