Workflow
半导体行业观察
icon
搜索文档
美台达成芯片协议,台积电将在美建11座工厂?
半导体行业观察· 2026-01-16 09:48
美台贸易与投资协议 - 美国与台湾达成协议,将特朗普时期对台湾商品征收的20%“对等”关税削减至不超过15%,与对日本和韩国的关税保持一致 [1] - 作为协议的一部分,台湾的芯片和科技公司将承诺在美国投资至少2500亿美元,以扩大美国的芯片制造、能源和人工智能产能 [1] - 台湾还将提供至少2500亿美元的信贷担保,以促进台湾企业在美国的额外投资,支持在美国建立和扩展完整的半导体供应链和生态系统 [1] - 协议涵盖双向投资机制,美国将扩大对台湾“五大信赖产业”的投资,包括半导体、人工智能、国防科技、安防监控、下一代通信和生物技术 [1] - 美国对台湾汽车零部件、木材、木料及木制品征收的国家安全关税(第232条款关税)也将不超过15%,而仿制药、飞机零部件等特定商品将免征关税 [1] - 关税下调预计将显著提升台湾传统产业(如机床和手工工具)的竞争力 [1] 台积电的美国投资与扩张计划 - 台积电去年已承诺追加1000亿美元投资,近期又将资本支出提高至创纪录的560亿美元,并计划继续加快在美国的投资 [1] - 据报道,台积电计划将其在亚利桑那州的总投资额从1650亿美元大幅增至4650亿美元,此计划与美台贸易协议相关 [3] - 台积电计划在亚利桑那州新建至少五座晶圆厂,使该地区晶圆厂总数达到约11座,此外还包括两座先进封装厂和一个本地研发中心 [3] - 台积电亚利桑那州第一座晶圆厂已于2024年第四季度采用N4工艺量产,第二座晶圆厂建设已于2025年完成,计划2028年采用N3工艺量产 [4] - 第三座晶圆厂已于2025年4月破土动工,计划采用N2和A16工艺技术,目标是在本十年末实现量产 [4] - 台积电已为实体扩张做准备,以约1.97亿美元的价格购得了位于凤凰城现有厂址旁约900英亩(约364公顷)的土地 [4] 行业影响与挑战 - 将产业投资与关税政策直接联系,是此次方案的显著特点,其影响远超半导体领域 [5] - 在美国本土扩大尖端产能有助于提升供应链韧性,而台湾需权衡先进技术“双源”生产与本土制造业战略价值的关系 [5] - 大规模扩张(11座晶圆厂加封装和研发)可能面临运营瓶颈,包括人员、设备和基础设施的挑战,尤其是EUV光刻设备交付周期长 [4] - 先进封装产能已变得至关重要,扩大州内封装规模可减少美国客户的物流摩擦,但也会导致对专业技能和电力/水供应的需求集中在凤凰城地区 [5] - 台积电近期的市场关注焦点在于具体的里程碑:审批流程、生产计划、模具方案以及客户分配,其下一季度财报可能透露相关资本支出计划的线索 [5]
英特尔的先进封装,太强了
半导体行业观察· 2026-01-16 09:48
英特尔EMIB先进封装技术解析 - 英特尔将其EMIB互连解决方案与传统的2.5D技术进行比较,并展示了其在设计先进封装芯片方面的优势 [1] - 该技术已被应用于英特尔多款数据中心产品,包括Ponte Vecchio、Sapphire Rapids、Granite Rapids、Sierra Forest以及即将推出的Clearwater Forest [1] - 公司已展示如何扩展其先进封装能力,以生产包含多个芯片组、均通过EMIB互连的下一代数据中心芯片解决方案 [1] EMIB技术原理与优势 - EMIB技术无需在芯片和封装之间使用硅中介层,而是将小型硅桥嵌入封装基板内,可灵活安装在需要连接两个芯片的位置 [11] - 与使用硅中介层和硅通孔的2.5D封装相比,EMIB避免了为仅用于连接导线的硅片支付额外费用,并降低了设计复杂性和对良率的影响 [8] - 该技术提供了三大关键优势:保持在正常的封装良率范围内、提供了节约成本的机会、设计更简单 [14][16] - EMIB支持二维和三维扩展,提供了比传统2.5D方法更大的芯片布局灵活性,并支持采用多种芯片的灵活异构系统 [13][14] EMIB技术变体与应用 - EMIB主要有两种变体:EMIB 2.5D和EMIB 3.5D [11][12] - EMIB 3.5D将EMIB与Foveros 3D集成在一个封装中 [12] - EMIB-M在桥式电路中采用MIM电容,EMIB-T则在桥式电路中增加了TSV封装,可以简化其他封装设计中的IP集成 [13] - 该技术自2017年以来已采用英特尔和外部芯片进行大规模生产,生产已验证 [13] - 英特尔数据中心GPU Max系列SoC采用了EMIB 3.5D技术,是英特尔迄今为止量产的最复杂异构芯片,拥有超过1000亿个晶体管、47个有源芯片单元和5个制程节点 [13] 与竞争对手技术的对比 - 竞争对手(例如台积电)的先进封装技术基于2.5D和3D封装,使用硅中介层和硅通孔实现互连 [3] - 传统2.5D封装在芯片尺寸增大时成本更高,且存在最大尺寸限制,导致芯片组合的灵活性不足 [8] - 英特尔的先进封装解决方案将加剧与台积电CoWoS解决方案的竞争,后者也推出了集成超过12个HBM4E芯片的大型封装方案 [18] 下一代先进封装技术蓝图 - 英特尔展示了其新一代、可大规模扩展的封装能力,相关技术将为高性能计算、人工智能、数据中心等领域的下一代芯片树立标准 [18] - 用于下一代计算的主要技术包括:采用RibbonFET 2和PowerDirect的英特尔14A-E、首款采用背面供电的Intel 18A-PT、Foveros Direct 3D精密堆叠、增加了TSV的下一代EMIB-T、对最新及未来HBM标准的无缝支持,以及突破传统光刻限制的可扩展架构 [20] - 公司展示了两种先进封装芯片概念设计:一款配备四个计算单元和12个HBM内存位点,另一款配备16个计算单元和24个HBM内存位点,LPDDR5X控制器的数量在更大的解决方案中可达48个 [20][21] - 具体设计包含采用18A-PT工艺的计算基片,其上通过Foveros 3D堆叠连接采用14A/14A-E工艺制造的主计算芯片,多个芯片再通过EMIB-T互连并与内存解决方案(如最多24个HBM位点)连接 [23][25][27] 对代工业务与行业竞争的影响 - 此次先进封装芯片展示面向外部客户,旨在推广其14A工艺节点,该节点专为第三方客户设计,而18A节点主要用于内部产品 [31] - 凭借展示的先进封装解决方案,英特尔似乎已在晶圆代工领域占据了一席之地,其真正的考验在于从第三方获得订单 [31][33] - 公司制定了多元化的生态系统参与计划,直接与行业合作伙伴合作以加快产品上市速度并增强供应链韧性 [29] - 随着英特尔加大对晶圆厂业务的投入,其EMIB技术的改进(如“T”型封装和Foveros封装)吸引了众多业内巨头的关注,加剧了此前由台积电主导的芯片制造行业的竞争 [17]
安靠关闭封测工厂,股价暴跌
半导体行业观察· 2026-01-15 09:38
公司近期股价表现与事件 - 2025年1月14日,公司股价暴跌6.31%,收于48.67美元[1] - 2025年1月5日,公司股价飙涨12.14%,收于48.13美元,创下自2000年6月以来的逾25年收盘新高[2] - 2025年迄今,公司股价累计上涨约23%[1],2025年全年股价飙涨53.68%[2] 日本工厂关闭计划 - 公司计划在2027年12月之前关闭位于日本北海道函馆的工厂[1] - 函馆工厂拥有380名员工,负责用于汽车等用途的通用半导体封装[1] - 关闭原因是2023年后电动车销售低迷导致车用产品需求不振,该工厂生产产品的未来需求展望低于预期且难以复苏[1] - 部分产品将结束生产,其余产品目标在2027年4月前转移至其他工厂,最迟于2027年底完成整合[1] 业务与市场定位 - 公司是全球领先的半导体封装和测试外包服务提供商,提供晶圆凸块、封装设计、系统级测试及先进封装解决方案[2] - 半导体行业是公司的主要销售驱动力,占比高达34.57%[3] - 公司已定位为先进封装供应商,并与英伟达在人工智能基础设施领域开展合作[3] - 在先进封装市场覆盖率排名上,公司与英特尔不相上下[4] 先进封装(CoWoS)机遇与产能扩张 - 分析师看好公司将成为先进封装CoWoS领域的明确赢家,并将目标价从37美元调高至50美元[2] - 为应对台积电带来的需求,公司预计在今后5年内构建月投片量约5万片的CoWoS产能[3] - 英伟达控制着全球约60%的CoWoS需求[3] - 公司正与英特尔合作,承接其EMIB封装业务外包,以帮助英特尔提升产能[4] 美国本土化战略与投资 - 公司位于美国亚利桑那州皮奥里亚、投资70亿美元的工厂正在为超越Blackwell芯片的先进封装技术做准备[4] - 根据美国《芯片与科学法案》,公司将获得4.07亿美元的激励资金[4] - 该工厂计划于2027年中期完成一期工程建设,并于2028年初实现量产[4] - 此举旨在推进半导体供应链在美国本土化的进程[6] 财务表现与未来展望 - 过去三年营收增长疲软:2022年同比增速15.5%,2023年-8.3%,2024年-2.9%[5] - 在AI发展推动下,2025年营收同比增速反弹至0.14%[5] - 预计2025财年总营收将达到66.5亿美元,同比增长5.31%[5] - 过去四个季度营收均超出预期,其中2025年第三季度超出预期20.75%[5] - 预计2025年第四季度营收将在17.75亿美元至18.75亿美元之间,中值预测为18.25亿美元[5] - 预计2026年营收可达72.7亿美元,同比增长9.29%,主要得益于英伟达可能带来的更多订单[6] - 公司目前净利润为负增长15.89%,主要因积极投资亚利桑那州工厂[6] - 预计2026年每股收益将从过去12个月的1.24美元(同比下降16.2%)增长至1.7美元(同比增长36.66%)[6] 行业催化剂与增长驱动 - 短期催化剂将在2026年到来,届时美国预计将开始量产先进封装芯片,H200芯片将成为推动短期增长的关键因素[4] - 人工智能的蓬勃发展有望推动公司营收增长[5]
三星将关闭8英寸晶圆代工厂
半导体行业观察· 2026-01-15 09:38
三星8英寸晶圆厂产能调整 - 三星计划于2024年下半年关闭其位于器兴工厂的8英寸晶圆厂S7,该工厂月产能为5万片晶圆 [1] - 关闭S7工厂后,三星8英寸晶圆的总月产能将从25万片降至20万片以下 [1] - 三星8英寸晶圆厂目前的开工率约为70%,公司认为在产能利用率较低的情况下,没有必要维持三座8英寸晶圆厂 [1] - 公司将资源集中于利润更高的12英寸晶圆厂,用于生产CMOS图像传感器和显示驱动芯片等主要产品,且研发重点也在于12英寸晶圆厂 [1] - 维护8英寸晶圆厂的成本日益高昂,且三星晶圆代工的客户数量和批量生产的芯片数量均少于竞争对手 [1] 全球8英寸晶圆行业趋势 - 据TrendForce预测,2024年全球8英寸晶圆厂的产能预计将比2023年下降2.4% [2] - 尽管供应下降,但需求依然旺盛,特别是用于人工智能服务器的电源管理集成电路需求旺盛 [2] - 2023年全球8英寸晶圆厂的平均开工率为75%至80%,预计2024年将升至85%至90% [2] - 一些公司计划将8英寸晶圆代工服务价格提高5%至20% [2] - 台积电自2023年以来一直在削减其8英寸晶圆厂的产能,预计部分工厂将于2025年完全关闭,三星自2023年以来也一直在削减其8英寸晶圆厂的产能 [2] 对竞争对手的潜在影响 - 三星削减8英寸晶圆厂产能可能会使韩国代工厂DB Hitek受益,DB Hitek的晶圆厂目前满负荷运转,订单积压严重 [2] - DB Hitek专精于模拟工艺(如BCD工艺),能够小批量生产电源管理IC和显示驱动IC等芯片 [2] - 如果三星和台积电削减其8英寸晶圆厂的产能,它们的客户订单很可能会流向DB Hitek [2] - DB Hitek在8英寸晶圆代工领域的竞争对手包括台湾的世界先进半导体、联华电子,中国的中心国际以及以色列的Tower半导体 [3] - 中心国际以极具竞争力的价格提供服务,并且订单量不断增长 [3] - Key Foundry的开工率仅为90%,盈利能力被认为较低 [3]
SK海力士完成中国工厂升级,加速扩产
半导体行业观察· 2026-01-15 09:38
无锡工厂工艺升级 - 核心生产基地无锡工厂已完成从1z到1a的DRAM工艺升级,1a为第四代10nm工艺,性能优于第三代1z工艺 [1] - 改造仅用两年时间完成,目前该厂基于12英寸晶圆的月产能为18万至19万片,其中约90%的产能已由1a工艺占据 [1] - 无锡工厂产量占公司DRAM总产量的30%至40%,其成功升级消除了因美国设备出口限制可能引发的生产和运营中断风险 [1] - 尽管1a DRAM需要EUV光刻技术且相关设备受美国限制无法进口,公司通过在韩国完成EUV关键工艺、在无锡完成剩余工序的替代方案实现了升级 [1][2] - 公司总裁强调中国工厂对全球存储器半导体供需至关重要,为确保其持续运营,将密切关注美国监管动态并与各国政府保持沟通 [2] - 自2006年投产以来,公司已在无锡工厂投资数万亿韩元 [2] 全球产能扩张与生产布局 - 公司计划将韩国龙仁新芯片工厂的首家工厂开业时间提前三个月至2027年2月,以应对激增的内存需求 [4] - 公司计划于下个月(2月)开始向韩国清州的新晶圆厂M15X部署硅晶圆,以生产高带宽存储器芯片 [4] - 龙仁晶圆厂是公司计划投资600万亿韩元(约4070亿美元)建设“半导体集群”的一部分,该集群最终将容纳四座晶圆厂 [4] - 未来的生产结构规划为:通用DRAM产品在中国生产,而尖端DRAM产品在韩国生产 [2] - 公司预计将加快其国内DRAM晶圆厂向相当于第六代1c工艺的升级,投资将集中在利川的M14和M16晶圆厂 [2] 市场需求与行业背景 - 全球内存芯片短缺推高了手机、个人电脑等消费电子产品的价格,并减缓了人工智能所需数据中心的建设 [4] - 市场正经历前所未有的繁荣,仅2023年第四季度,部分存储芯片产品价格就比上年同期上涨了300%以上,原因是人工智能基础设施需求激增导致产能紧张 [5] - 客户(包括超大规模数据中心)越来越多地寻求多年供应协议,而非过去常见的一年期合同,以争相锁定长期供应 [5] - 公司高管表示内存芯片市场正在发生结构性变化,尚未看到需求放缓的迹象,并称“看到了巨大的需求” [5] - 公司是英伟达的关键合作伙伴,必须支持人工智能基础设施的内存消耗 [4] - 公司每月都会审查其产品的生产计划,以确保能够为客户提供支持 [5] - 公司是全球第二大存储芯片制造商,其股价在过去一年中上涨了280% [5]
带宽战争前夜,“中国版Groq”浮出水面
半导体行业观察· 2026-01-15 09:38
AI推理芯片行业趋势:从算力竞赛转向带宽战争 - AI行业竞争焦点正从单纯算力比拼转向对单位面积带宽的极致追求[4] - 大模型推理中90%的延迟源于数据搬运,导致算力利用率常低于30%[4] - 行业共识是通过存储靠近计算、流式执行与片上带宽构建来提升推理效率,AMD、d-Matrix、SambaNova等公司均印证此方向[4] 英伟达的战略布局:收购与架构革新 - 英伟达斥资200亿美元收购Groq核心技术,创公司历史最大交易,旨在抢占AI推理市场[2] - 计划于2028年推出新一代Feynman架构GPU,采用台积电A16制程与SoIC 3D堆叠技术,核心目的是在GPU内部深度集成Groq的LPU(语言处理单元)[2] - 此举旨在解决AI推理中长期存在的“带宽墙”与“延迟瓶颈”,推动公司从“算力霸主”向“推理之王”转型[2] 传统GPU在推理任务中的瓶颈 - 英伟达GPU架构最初为大规模训练与图形渲染设计,强调峰值算力与吞吐能力[14] - 在大模型推理的Decode阶段,GPU性能瓶颈主要来自对外部存储(HBM)和复杂内存层级的高度依赖[14] - 该过程呈现强序列性、小批量和带宽主导特征,与GPU设计初衷错配,导致访存延迟波动、算力难以稳定发挥[14] 寒序科技:中国MRAM推理芯片的开拓者 - 公司源于北京大学物理学院,以“超高带宽推理芯片”为核心产品,被业内视为中国大陆少有的在技术路线层面对标Groq的团队[6] - 采用“双线布局”:SpinPU-M系列磁概率计算芯片覆盖组合优化市场;SpinPU-E磁逻辑计算芯片系列直指大模型推理解码阶段加速[7] - 核心技术路线是片上MRAM(磁性随机存储器),构建超高带宽磁性流式处理架构(MSA)[7][9] - 目标是将访存带宽密度提升至0.1-0.3 TB/mm²·s,比肩Groq LPU(0.11 TB/mm²·s),是英伟达H100(0.002-0.003 TB/mm²·s)的数十倍[12] - 公司是国内首个有能力跑通从物理、材料、器件到芯片设计、算法全链条的交叉团队,拥有“材料-器件-芯片-系统-算法”的全栈攻关能力[16] MRAM技术的优势与战略价值 - **存储密度领先**:MRAM采用1T1M结构,同等芯片面积和工艺节点下,存储密度是SRAM的5-6倍[11] - **工艺成本更低**:MRAM在国产成熟制程(如28nm/22nm)下性能可对标先进制程的SRAM,单片流片成本可降至原来的十分之一以下,保障供应链自主可控[20] - **非易失性与高能效**:断电后数据不丢失,待机功耗接近零,具备快速启动、高耐用性优势,为边缘和云端部署提供极佳能效[20] - **规避技术封锁**:美国出口管制限制内存带宽密度超过2GB/s/mm²的存储器,而HBM产能被海外巨头垄断,Groq的SRAM方案成本极高。MRAM基于成熟制程实现超高带宽,可规避对尖端工艺和海外供应链的依赖[21] - **市场前景广阔**:2024年全球MRAM市场规模估计为42.2亿美元,预计到2034年增长至约847.7亿美元,复合年增长率高达34.99%[30] 国内外MRAM产业发展现状 - **国际大厂积极布局**:台积电、三星、英特尔、SK海力士等已将嵌入式MRAM推进到22nm、16nm等节点。恩智浦、瑞萨电子、GlobalFoundries等已在汽车、工业领域推动MRAM商业化落地[23] - **国内生态初步形成**:RRAM领域有昕原半导体等玩家;MRAM赛道有寒序科技、致真存储、驰拓科技、凌存科技、亘存科技等企业[26] - **国内厂商侧重各异**:致真存储专注于MTJ器件与制造工艺,研制出全球首颗8Mb容量SOT-MRAM芯片;驰拓科技是国内首家实现MRAM量产的企业;凌存科技专注于存储模块开发[27] - **寒序科技的差异化定位**:以MRAM为核心介质构建计算芯片,开辟“磁性计算”新赛道,推动国内MRAM技术从存储替代向计算革新跨越[28][29] 下一代AI推理芯片的竞争格局 - 下一代竞争分水岭在于“谁能率先跨过带宽墙”,主导市场者需在“带宽战争”中沉淀出护城河[35] - 两条突破路径清晰:一是Groq选择的极致SRAM片上集成路径;二是以MRAM为代表的新型存储介质路线,后者更具根本性且符合长期成本与供应链安全需求[35] - “通用算力+专用引擎”成为行业趋势,英伟达收购Groq整合LPU即是例证。国内AI芯片厂商应加强与在新型介质与架构上有底层创新能力的团队合作[32] - 以MRAM为代表的新型存储已成为后摩尔时代核心焦点,有望成为中国AI芯片产业实现换道超车的关键抓手[33]
三星抢了高通芯片大客户?
半导体行业观察· 2026-01-15 09:38
合作核心内容 - 三星电子与特斯拉达成协议,将首次向特斯拉供应汽车5G调制解调器 [1][3] - 合作预计于2025年上半年正式启动,首批芯片将应用于特斯拉在德克萨斯州运营的Robotaxi自动驾驶出租车队 [1][3] - 此次合作源于2023年5月三星董事长李在镕与特斯拉CEO埃隆·马斯克在硅谷的重要会晤,双方当时广泛讨论了在自动驾驶AI芯片和汽车通信组件方面的合作 [1][4] 合作背景与战略意义 - 此举标志着特斯拉供应链的重大转变,此前特斯拉一直严重依赖高通提供的芯片维持汽车互联网连接 [1][4] - 特斯拉正试图减少对高通的依赖,并围绕美国和韩国重组其供应链 [4] - 三星将借此机会证明其技术实力可拓展至快速发展的高科技汽车领域,而不仅限于智能手机 [1] - 对于三星系统LSI部门意义重大,可能为其将之前专注于智能手机的调制解调器业务拓展到汽车应用领域提供契机 [5] 技术要求与研发 - 车载5G调制解调器要求严苛,必须能够承受极端高温、低温和震动,并且使用寿命超过十年 [1][3] - 三星电子系统LSI事业部已完成为特斯拉汽车开发的5G调制解调器的研发,目前正在进行测试 [3] - 为满足特斯拉要求,三星电子开展了一项独立的研发流程 [3] - 系统LSI部门负责芯片设计,模块化则由一家合作伙伴公司负责 [3] 合作范围与扩展 - 双方合作将涵盖AI芯片和通信芯片,此前在2025年7月28日,两家公司已宣布签署一份价值22.7648万亿韩元的AI6芯片代工合同 [4] - 如果Robotaxi在德克萨斯州的推广进展顺利,预计三星芯片最终会应用到特斯拉的Model 3和Model Y等消费级车辆中 [2] - 特斯拉凭借全自动驾驶技术处于市场领先地位,与三星的合作可能引发其他汽车制造商效仿 [5] 地缘政治与供应链策略 - 特斯拉选择三星可能受到其“OOC/OOT”政策影响,该策略旨在将中国大陆和台湾地区的零部件排除在供应链之外 [5] - 该政策也被称为“NCNT”,随着美中冲突持续以及台海局势紧张,美国企业正积极推进供应链多元化 [5] - 据2024年5月《日经新闻》报道,特斯拉已要求其供应商在中国大陆和台湾以外的地区生产,并希望从2025年开始将此理念应用于新项目 [6]
新思官宣:出售ARC业务
半导体行业观察· 2026-01-15 09:38
收购交易概述 - GlobalFoundries宣布已签署最终协议,收购Synopsys的ARC处理器IP解决方案业务,包括其工程师和设计师团队[1] - 拟议收购的资产包括ARC-V、ARC-Classic、ARC VPX-DSP和ARC NPX NPU产品线,以及ASIP Designer和ASIP Programmer等应用专用指令集处理器工具[1] - 交易预计将于2026年下半年完成,须满足惯例成交条件并获得必要的监管批准[2] 战略目标与整合计划 - 此次收购旨在加速GlobalFoundries和MIPS在物理AI领域的路线图,并增强其在定制芯片解决方案方面的能力[1] - 交易完成后,收购的资产和专家团队将整合到GlobalFoundries旗下的MIPS公司,以提供一套专为物理AI应用量身定制的全面处理器IP套件[1] - 通过将Synopsys的ARC IP和MIPS技术与GlobalFoundries的先进制造能力相结合,公司旨在降低客户采用关键技术的门槛,帮助客户更快地创新[2] 预期协同效应与市场影响 - 整合Synopsys的ARC技术将实现可扩展、高能效的处理解决方案,其技术涵盖高性能、中端和超低功耗计算及AI内核[1] - 此次收购将增强公司为可穿戴设备、机器人、AI驱动的消费应用和先进AI芯片提供解决方案的能力[1] - 扩展后的产品和服务将通过IP许可和软件增强客户互动,从而帮助GlobalFoundries的客户更快地将产品推向市场[1] - 此举将强化公司差异化的技术路线图,并使GlobalFoundries能够为客户提供端到端的解决方案,支持AI设备向物理世界的扩展[2] 交易各方立场 - GlobalFoundries首席执行官表示,此次收购巩固了公司致力于在物理AI领域保持领先地位的承诺[2] - Synopsys将保留并继续扩展其涵盖逻辑库、嵌入式存储器、接口IP、安全IP和子系统的广泛设计IP产品组合[2] - Synopsys总裁兼首席执行官认为,此次交易将巩固其IP业务在关键接口和基础IP领域的领先地位,同时赢得新的高价值机遇[2] - Synopsys表示,GlobalFoundries将成为处理器IP解决方案业务未来卓越的管理者,使全球客户受益于该领域持续激烈的竞争[2]
AI芯片公司,拿下OpenAI百亿美元大单
半导体行业观察· 2026-01-15 09:38
交易核心信息 - OpenAI与Cerebras Systems达成一项价值超过100亿美元的协议,将在未来三年内购买高达750兆瓦的计算能力 [1] - 该产能将分批投入使用,直至2028年 [3] - Cerebras设计的AI芯片声称其运行AI模型和生成响应的速度比行业领导者英伟达更快 [1] 合作背景与战略动机 - OpenAI正加紧获取更多数据中心容量,为下一阶段增长做准备,公司每周用户超过9亿,并面临严重的计算资源短缺 [5] - OpenAI也在寻找比英伟达芯片更便宜、更高效的替代方案,此前已宣布与博通合作开发定制芯片,并签署协议使用AMD的新型MI450芯片 [5] - OpenAI的计算战略是构建弹性系统组合,将合适的系统与合适的工作负载相匹配,Cerebras为其平台增加了专用的低延迟推理解决方案 [2] - OpenAI基础设施主管表示,公司收入的最大预测指标是计算能力,过去两年计算能力与收入每年都增长了两倍 [6] Cerebras公司情况 - Cerebras正在洽谈以220亿美元的估值融资10亿美元,这将使其估值增长近三倍,此前已累计筹集18亿美元资金 [7] - Cerebras成立于大约十年前,在2024年提交上市申请时披露其大部分收入来自一家客户(G42),后撤回上市计划并通过私募融资11亿美元,估值为81亿美元 [8] - 该公司此后已与IBM和Meta签署了新的合作协议 [8] - Cerebras联合创始人兼首席执行官表示,与OpenAI合作是将世界领先的AI模型带到世界上速度最快的AI处理器上,实时推理将改变AI [2] 行业竞争与市场动态 - 专注于推理(运行训练好的AI模型生成响应)的芯片初创公司需求旺盛,AI公司竞相获取能提供快速、经济高效计算能力的尖端技术 [7] - 英伟达去年12月与Groq签署了一项价值200亿美元的授权协议,今年9月还与OpenAI签署了一项初步协议,拟向其出售价值高达10吉瓦的芯片,但该协议尚未最终敲定 [7] - OpenAI首席执行官Sam Altman是Cerebras的个人投资者,两家公司曾在2017年探讨过合作事宜 [1][8] OpenAI的财务状况与增长计划 - OpenAI去年营收约为130亿美元,仅占其与Oracle、微软和亚马逊签署的近6000亿美元新云合同的一小部分 [8] - OpenAI首席执行官表示,公司将通过未来的营收增长来支付这些分阶段履行的合同款项 [8] - OpenAI正处于新一轮大规模融资的早期阶段,以继续为其庞大的增长计划提供资金,预计在新投资前其估值可能达到8300亿美元 [9]
终极3D集成,将颠覆GPU
半导体行业观察· 2026-01-15 09:38
文章核心观点 - Imec的研究表明,将高带宽内存(HBM)以3D方式堆叠在GPU顶部在热管理上面临巨大挑战,初始模拟温度高达141.7°C,远超安全工作极限[1][3][23] - 通过一系列系统与设计协同优化(XTCO)措施,包括移除HBM基片、合并内存堆栈、降低GPU频率、优化导热硅以及采用双面冷却,最终可将峰值温度降至约70.8°C,接近当前2.5D封装的69.1°C水平[26][42] - 尽管热问题在技术上可能被解决,但实现3D HBM-on-GPU集成需要行业在供应链、芯片设计、散热生态系统等方面进行重大变革,且涉及性能权衡,目前这更接近于一份技术路线图,而非即将上市的产品方案[41][46][49] 当前2.5D封装与3D堆叠的对比 - **当前主流方案**:采用2.5D封装,GPU和HBM并排放置在中介层上,通过微米级铜互连连接,GPU功耗414瓦时峰值温度低于70°C,HBM功耗约40瓦且温度更低[3][14] - **2.5D的局限性**:HBM模块占据了GPU边缘的布线空间和海岸线,限制了封装内GPU之间的直接互连以及单个封装上可集成的计算单元数量[17] - **3D堆叠的潜在优势**:将HBM垂直堆叠于GPU之上可释放芯片周围的I/O空间,实现更紧密的多GPU连接,并将内存到处理器的距离缩短至几乎为零,有望带来更高的带宽和更低的延迟[3][19] - **3D堆叠的核心挑战**:最直接的堆叠方式会导致GPU工作温度飙升至141.7°C,远超典型GPU的80°C限制和现代数据中心约70°C的要求[3][23] Imec提出的热优化方案与效果 - **移除HBM基片**:在3D堆叠中,HBM下方的逻辑基片(用于数据多路复用)不再必要,移除后可使温度从141.7°C降至138.0°C,降幅约3.7°C,同时有望大幅提升内存带宽[4][26][27] - **合并HBM堆栈**:将四个独立的HBM堆栈横向融合成两个更宽的堆栈,消除了堆栈间的隔热材料,此举将峰值温度从138.0°C显著降至120.4°C,降幅约17.6°C[26][27][29] - **降低GPU时钟频率**:将GPU频率降低50%,使其功耗从约414瓦降至约300瓦,这是最有效的单步降温措施,将温度从120.4°C降至99.2°C,降幅超过20°C[26][34][42] - **优化导热硅填充**:在热点区域填充高导热性硅块以形成垂直散热通道,此步骤将温度从99.2°C进一步降至87.4°C[26][37][42] - **采用双面冷却**:在封装顶部液冷(30 W/cm²·K)的基础上,于芯片底部增加冷却,最终将峰值温度降至70.8°C,非常接近2.5D基准的69.1°C[26][38][40][42] 性能权衡分析 - **频率降低的影响**:将GPU频率减半会损失原始计算吞吐量,但对于GPT-175B等内存密集型AI工作负载,性能损失可被内存带宽提升部分抵消[34][43] - **性能模拟数据**: - 全频运行的3D堆叠设计(理论)比2.5D设计性能提升68%,但温度不可行(142°C)[45] - 将3D设计频率减半后,其性能仍比全频运行的2.5D设计高出22%[45] - 若假设3D堆叠能带来4倍内存带宽提升(第二代模型),则半频3D设计相比全频2.5D设计的性能提升可达46%[45] - **市场接受度问题**:将芯片标称峰值性能减半对于市场营销是巨大挑战,可能使产品更偏向特定内存优化型垂直市场,而非通用AI加速器[47][49] 行业实施的挑战与可行性 - **HBM供应链与设计变革**:移除基片和合并堆栈需要内存供应商为特定客户进行定制化设计,改变批量通用化模式,并面临良率、成本和供应链的严峻挑战[27][46] - **散热生态系统变革**:实现可行的3D集成需要采用双面冷却等更复杂的散热方案,这改变了整个封装的散热设计范式[40][48] - **技术集成复杂性**:3D HBM-on-GPU要求电力与数据信号垂直穿过内存堆栈到达GPU,设计更为复杂[6] - **替代技术路径**:行业同时存在其他研究方向,如探索2.5D双层HBM模块,或采用Celestial AI的光互连方案将内存与计算分离[49] - **结论性定位**:Imec的研究为3D HBM-on-Logic集成提供了技术可行性的路线图,证明了通过系统级优化可解决热瓶颈,但其实现需要行业多年的协同努力,并非短期可上市的产品方案[11][41][49]