半导体行业观察
搜索文档
台积电在美国,再建5座晶圆厂
半导体行业观察· 2026-01-13 09:34
美台贸易协议与台积电投资 - 特朗普政府正与台湾进行一项贸易协议谈判,旨在将美国对台湾商品的关税税率从20%降至15%,与日本和韩国的税率基本一致 [1] - 作为协议的一部分,台积电将承诺在美国亚利桑那州至少新建五座半导体工厂,使其在该州的工厂总数大致翻倍 [1] - 该协议已进行数月谈判,目前正在进行法律审查,有望在本月宣布 [1] 台积电在美投资计划 - 台积电自2020年已在亚利桑那州建成一座工厂,第二座工厂正在建设中计划2028年投产,并已承诺未来几年再建四座工厂 [2] - 作为贸易谈判的一部分,台积电同意在原有计划基础上,至少再增建五座工厂 [2] - 台积电去年3月宣布加码投资美国1,000亿美元,加上原计划的650亿美元投资,对美总投资额达到1,650亿美元 [5] - 美国商务部长卢特尼克透露,台积电的投资规模还会更高,但未详述具体加码金额 [6] 贸易谈判背景与关税政策 - 自4月宣布对数十个贸易伙伴加征关税后,特朗普政府一直通过谈判降低关税,以换取投资承诺和符合美国国家安全利益的交易 [1] - 台湾产品进口商目前需缴纳20%的关税,但美国政府豁免了半导体和许多电子产品的关税 [2] - 特朗普政府利用国家安全法对钢铁、铝、汽车等多种商品加征关税,并曾考虑根据“第232条”对半导体行业启动调查 [2] - 台湾贸易办公室表示,双方已就一项包括降低关税和给予台湾232条款优惠待遇的贸易协议达成广泛共识 [3] 投资背后的驱动因素 - 特朗普政府希望台湾加大对美国半导体制造业的投资,因为台湾在全球芯片生产中占据主导地位 [1] - 美国商务部长卢特尼克指出,特朗普政府的做法是扬言课征关税,以促使台积电同意在美设厂 [6] - 卢特尼克称,特朗普政府以台积电违反合约中的DEI条款为由,要求其追加1,000亿美元投资以换取豁免,从而达成了协议 [6] - 半导体占台湾出口总额的三分之一以上,其中最有价值的芯片来自台积电在台湾的20多家工厂 [2] 市场反应与公司动态 - 台积电目前处于法说会前缄默期,对相关投资消息不予评论 [5] - 台积电股价在消息传出后一度追平历史天价1,705元新台币,终场收于1,690元,市值增至43.83万亿元新台币 [5] - 外资在法说会前连续七个交易日卖超台积电,累计卖超约5.9万余张 [5]
恒玄公告:创始人减持
半导体行业观察· 2026-01-13 09:34
恒玄科技股东减持计划公告核心摘要 - 公司控股股东之一致行动人及另一持股5%以上股东分别计划减持不超过公司总股本的1.50% [1][2] - 两方股东计划减持股份总数均为2,530,406股,合计不超过公司总股本的3.00% [2][7][8] - 减持计划实施期间为2026年2月3日至2026年4月30日,减持原因为股东自身资金需求 [2][7][8] 减持主体基本情况 - **控股股东之一致行动人 (宁波百碧富、千碧富、亿碧富)** - 合计持有公司股份10,373,706股,持股比例为6.15% [1][3] - 股份来源均为公司首次公开发行前取得,已于2023年12月18日解除限售 [1] - 该组股东与汤晓冬、赵国光、Liang Zhang构成一致行动人,合计持股51,601,255股,占总股本30.59% [4] - **持股5%以上股东 (Run Yuan I, Run Yuan II)** - 合计持有公司股份13,435,030股,持股比例为7.96% [1][3] - 股份来源均为公司首次公开发行前取得,已于2021年12月16日解除限售 [1] - 两者为同一控制下企业,合计持股占总股本7.96% [4] 减持计划具体内容 - **减持股份数量与比例** - 两方股东计划减持数量上限相同,均为不超过2,530,406股,各不超过公司总股本的1.50% [2][7][8] - 通过集中竞价方式减持,各自不超过1,686,937股;通过大宗交易方式减持,各自不超过2,530,406股 [7][8] - **减持安排** - 减持期间:2026年2月3日至2026年4月30日 [2][7][8] - 减持价格:按减持实施时的市场价格确定 [2] - 若期间发生股本变动,减持比例保持不变,减持股份数将相应调整 [2] 股东近期减持历史 - **过去12个月内减持情况** - 控股股东一致行动人组(含汤晓冬等)在2025年7月29日至10月23日期间,减持1,990,336股,占当时总股本1.18%,减持价格区间为194.50-319.80元/股 [6] - Run Yuan I及Run Yuan II在同期(2025年7月28日至10月24日)减持1,343,404股,占当时总股本0.80%,减持价格区间为218.38-321.99元/股 [6] - 更早前(2024年12月至2025年3月),宁波百碧富等三家企业曾减持2,360,482股,占当时总股本1.97% [6] - Run Yuan I及Run Yuan II在2024年12月至2025年2月期间曾减持1,199,932股,占当时总股本1.00% [6]
苹果将彻底抛弃高通基带,芯片巨头遇劫
半导体行业观察· 2026-01-13 09:34
股价下跌与评级下调 - 高通公司股价周一下跌4.8%,盘后交易中跌至169.27美元,主要原因是瑞穗证券下调了其评级和目标股价 [1] - 瑞穗证券下调预期的理由包括:预计高通2026年的手机出货量及其“iPhone组件”业务将面临挑战,并将预期下调至多7% [1] - 该券商警告,由于苹果公司正在自主研发调制解调器技术,高通的市场份额可能出现下滑,且对苹果依赖程度的降低将成为2026年及以后业绩增长的主要阻力 [1] 手机业务面临逆风 - 手机市场依然疲软,且高通最大的客户苹果正将更多工作转移到公司内部,这构成了公司面临的主要“手机业务逆风” [1] - 尽管与苹果的协议保证至少在2026年前提供5G芯片,但市场已为苹果逐步实现5G技术自主化做准备,预期高通在苹果的份额最终将归零 [1][2] - 存储芯片涨价影响了PC和智能手机销售,给高通带来了新的挑战 [2] PC芯片性能对比 - 高通在CES 2026发布了面向Windows笔记本电脑的骁龙X2 Plus处理器,声称其性能优于同类英特尔和AMD芯片 [3] - 基准测试显示,骁龙X2 Plus在大多数CPU和GPU工作负载下,性能略逊于苹果M4芯片 [3] - 在Cinebench 2024单核测试中,X2 Plus性能优于Core Ultra 7 268V、Core Ultra 9 285H和Ryzen AI 9 HX Pro 375,但落后于Ryzen AI Max+ Pro 395和苹果M4 [4] - 在Geekbench 6 Pro单核测试中,X2 Plus取得3311分,超过了所有四款英特尔和AMD处理器,但落后于苹果M4 [7] - 在GPU测试(3DMark Steel Nomad Light和Solar Bay)中,X2 Plus的得分均低于英特尔、AMD和苹果的芯片 [7] 产品迭代与市场挑战 - 骁龙X2 Plus在大多数基准测试中的得分比前代产品X Elite高出约15%到50%,表明其速度有明显提升 [10] - 然而,该处理器在与苹果芯片和x86芯片的竞争中表现不佳,表明其在笔记本电脑市场的原始性能方面,距离挑战苹果、英特尔和AMD仍有很长的路要走 [10] - 需注意,本次基准测试使用的骁龙X2 Plus处理器运行在参考平台上,而其他芯片测试使用了市售产品,结果可能因芯片分级、散热、功耗等多种因素存在显著差异 [13]
英伟达,筑起新高墙
半导体行业观察· 2026-01-13 09:34
文章核心观点 - 英伟达通过一系列战略性交易(如与Groq达成协议、收购Bright Computing、Run.ai和SchedMD),系统性地构建了超越硬件(GPU)的生态壁垒,其战略重心正从统治训练算力转向掌控推理效率和整个AI计算系统的非硬件控制权,旨在通过整合集群调度、工作负载定义和企业级支持服务,大幅提高客户的迁移成本,从而巩固其市场主导地位 [1][2][4][7][23][24] AI芯片竞争格局与英伟达的战略焦虑 - AI芯片竞争焦点正从“训练为王”转向“推理决胜”,在推理端,AMD、定制ASIC及云厂商自研芯片正快速逼近,成本和供应链多元化成为客户现实诉求 [2] - 英伟达的焦虑源于AI产业重心从堆算力(FLOPS)转向高效、确定性地交付推理结果,其统治性的GPU在推理端的话语权可能被系统层逐渐侵蚀 [4][7] - 英伟达采取“收购式招聘”等操作,在不触碰监管红线的前提下,将潜在威胁(如Groq)纳入自身体系 [1] Groq的技术价值与英伟达的交易动机 - Groq的核心技术是自研的LPU架构,采用静态调度和确定性设计,使用SRAM而非HBM,主打极致低延迟和性能确定性,其创始人Jonathan Ross是谷歌第一代TPU的首席架构师 [5] - 2024年,Groq展示其系统运行Llama 2-70B模型时,生成速度超过每秒300个Token,远超主流GPU系统,吸引了金融、军事等对延迟敏感的垂直行业用户 [6] - 英伟达与Groq的交易并非为了补一块芯片,而是为了获取对执行路径的强约束、对延迟的可预测性以及编译器主导的算力使用方式等系统能力 [7] - 此次交易几乎具备收购的全部要素:技术被许可,团队被吸纳,关键人物离场,Groq最具决定性的资产已转移 [1] 英伟达构建集群控制体系的战略步骤 - **收购Bright Computing**:2022年1月,英伟达收购了集群管理工具Bright Computing(后更名为Base Command Manager),将其纳入AI Enterprise软件堆栈,按每个GPU每年4500美元的费用出售“系统能力”,把集群管理变为商业资产 [10][11] - **收购Run.ai**:2024年,英伟达收购Run.ai,其核心价值在于实现GPU资源的抽象化管理(多租户、弹性调度、GPU虚拟化),防止云厂商通过调度层稀释CUDA生态优势 [13] - **收购SchedMD**:2025年12月,英伟达收购了Slurm工作负载管理器背后的核心团队和技术支持公司SchedMD,Slurm在过去十年中约占Top500超级计算机60%的份额,是HPC和AI领域的事实标准 [17][18] - **整合与打包**:2024年10月,英伟达停止单独销售Bright Cluster Manager,仅将其作为AI Enterprise Stack的一部分提供,旨在将所有系统组件打包成不可分割的整体 [21] 英伟达构建的“生态城墙”三层结构 - **第一层:集群资源调度权**:通过Mellanox的网络互联、Bright Computing的集群管理、SchedMD的工作负载调度,控制算力连接、分配和执行的完整链条 [23] - **第二层:工作负载执行路径定义权**:通过Run.ai的GPU虚拟化、Mission Control的自动化部署和健康检查、Slurm的作业调度,共同定义任务如何运行,使迁移成本高企 [23] - **第三层:企业级支持与系统复杂度掌控权**:通过AI Enterprise许可证模式,将工具打包成“系统集成能力”商业服务,客户购买的是英伟达的优化经验与最佳实践 [24] - 这三层叠加使得客户理论上可选择其他硬件,但实践中迁移成本难以承受,英伟达的商业模式已从卖芯片质变为卖生态,GPU成为生态入口 [23][24]
SK海力士将投资900亿,建设封装厂
半导体行业观察· 2026-01-13 09:34
投资决策与规模 - SK海力士决定投资19万亿韩元(约合900亿人民币)在忠清北道清州市建设第七座半导体后端工厂(P&T7)[1] - 投资旨在响应政府区域均衡发展政策,并提升供应链效率与未来竞争力[1] - 工厂计划建于清州科技城工业园区内一块7万坪的土地上,工程于2025年4月开工,预计2026年底竣工[1] 工厂定位与战略重要性 - P&T7是一家先进封装厂,负责将前端晶圆厂生产的芯片封装成产品并进行最终质量验证[1] - 先进封装工艺对于连接前端工艺、物流和运营稳定性至关重要,其重要性随工艺小型化性能提升接近极限而日益凸显[2] - 该工厂对于SK海力士的旗舰产品高带宽存储器(HBM)尤为关键,因HBM由多个DRAM芯片堆叠而成,封装技术需有效解决散热和翘曲问题[2] 生产布局与集群效应 - P&T7建成后,公司将拥有三个先进封装中心:京畿道利川市、清州市以及美国印第安纳州西拉法叶[1] - 此项投资使清州园区发展为集NAND闪存、HBM、DRAM生产与先进封装于一体的综合性半导体产业集群[2] - 清州园区已拥有生产NAND闪存的M11、M12和M15晶圆厂,后端运营的P&T3工厂,以及投资20万亿韩元用于下一代DRAM产能的M15X工厂[2] 投资背景与驱动因素 - 投资决定基于对全球人工智能(AI)存储器需求的稳定响应,以及对清州工厂生产的优化[1] - 公司经过对国内外多个候选地点的考察,最终选择清州,综合考虑了区域均衡发展与增强半导体产业竞争力的需要[2] - 公司此前已拆除清州原LG 2号工厂旧址建筑,并根据半导体超级周期市场情况最终确定了建设时间和投资规模[1] 预期作用与协同效应 - P&T7工厂预计将在M15X前端晶圆厂生产的DRAM商业化为HBM的过程中发挥重要作用[2] - M15X工厂的洁净室已于2024年10月提前启用,目前正处于设备安装阶段[2] - 公司表示投资旨在为加强国家中长期产业基础做贡献,并创建首都圈与各省共同发展的结构[3]
数据中心芯片,要求很高
半导体行业观察· 2026-01-13 09:34
文章核心观点 - 数据中心作为现代经济的关键基础设施,对半导体和系统组件的可靠性要求极高,其设计必须追求近乎完美,因为系统故障可能导致巨大的经济损失[1] - 实现数据中心的高可靠性需要一套综合策略,包括在基础设施、网络架构、半导体组件等多个层面采用冗余设计、容错架构、先进遥测和快速故障恢复机制[2][3][4][5] - 尽管数据中心半导体在绝对工作温度和使用寿命要求上低于汽车等应用,但由于其部署规模和经济影响巨大,客户对可靠性数据、故障预测和极低故障率的要求极为严苛[9][10][11] - 高可靠性已成为数据中心半导体市场准入和获得认可的关键前提,与高性能、低功耗和低成本同等重要[12] 数据中心可靠性要求与重要性 - 数据中心故障的经济影响巨大,例如伊利诺伊州一个数据中心发生10小时的故障,导致全球货币和大宗商品市场的交易暂停[1] - 云服务提供商提供从99.9%到99.999%不等的正常运行时间服务等级协议,其中99.999%的月度最大停机时间仅为26秒[2] 数据中心基础设施可靠性策略 - 通过跨多个区域部署软件来实现冗余,能够快速在数据中心之间转移负载,避免单点故障[2] - 存储采用双副本设计,确保一个副本丢失时系统仍可运行[2] - 配备冗余的冷却系统和电力分配系统,并备有电池或发电机,以应对电网断电[2] 半导体与网络架构的可靠性设计 - 数据中心芯片和子系统采用容错架构,例如CPU使用ECC内存,HBM内存自HBM2起集成片上ECC,HBM3使用更强大的里德-所罗门码[3] - HBM具有冗余数据总线通道,运行中出现通道故障时可重新映射到备用通道[3] - 英伟达的NVLink72系统建议使用64个GPU运行,保留8个作为备用,以实现冗余[3] - NVLink网络使用18个交换机连接每个GPU,允许在某个交换机故障时进行重新映射而不影响性能,并支持热插拔故障组件以恢复冗余[3][5][8] - 横向扩展网络基于以太网,采用数据包重试、备用路由和错误检查,快速生成树协议能在几毫秒内切换故障路径[5] - 光路开关技术能在几毫秒内重新路由数百路光纤,以绕过故障芯片[6] 半导体组件的物理设计与可靠性挑战 - 人工智能加速器采用多芯片封装,各元件材料和温度的差异可能导致物理连接出现翘曲和断裂的风险[9] - 随着电频率提高以提升性能,信号完整性问题会降低数据传输可靠性,需要转向光传输来提高可靠性[5] 数据中心半导体的特定可靠性考量 - 数据中心芯片工作温度低于汽车应用,例如英伟达Blackwell GPU最高结温为85°C,AMD Epyc处理器典型最高为95°C,可短暂达到105°C,因为数据中心可负担昂贵的冷却系统来降低功耗并提高可靠性[10] - 数据中心设备出于会计目的的预计使用寿命在5到6年之间,远短于汽车,但可靠性设计仍至关重要,以确保在使用寿命内的低故障率[10] - 客户要求看到广泛的可靠性和压力测试数据,以实现极低的故障率,这涉及对成千上万个器件进行数月的高温、高频率测试,成本高昂[11] - 客户需要片上遥测技术来追踪故障先行指标,以便主动更换设备,例如通信设备中误码率的增加可作为早期预警[11] - 设备应能自我诊断并发出警报,以便快速定位和修复错误,供应商需要芯片遥测数据来改进故障预测能力,并通过故障分析来指导设计改进[11]
这个男人,力挽三星芯片狂澜
半导体行业观察· 2026-01-12 09:31
文章核心观点 - 韩国大型企业正从创始人主导模式转向依赖关键职业经理人进行管理 三星电子副会长全英贤作为关键人物 正领导其半导体部门进行彻底改革以重振竞争力[1] - 全英贤的回归与授权被视为三星已故会长李健熙时代“授权体系”的复兴 其专业背景和果断决策风格有望带领三星半导体应对当前危机并把握未来机遇[3][4] - 在副会长领导下 三星半导体各业务单元已显现复苏势头 但其中长期领导层的可持续性及应对AI时代新挑战的能力仍存疑问[7][9] 关键人物背景与角色 - 全英贤副会长于2024年5月接管三星电子DS(设备解决方案)机构部门 肩负重振亏损半导体业务的重任[3] - 其拥有传统工程师背景和半导体专业知识 是一位职业经理人 与公司内部由未来战略办公室老员工组成的“控制塔”体系不同[4] - 他于2000年从LG半导体加入三星电子 凭借卓越能力在14年内晋升为存储器事业部负责人 在其任内三星在移动和服务器DRAM技术领域领先竞争对手至少一年[5] - 2017年后一度被调离核心部门 2023年重返三星并赢得董事长李在镕的信任 被授予独立运营半导体业务的权力[3] 面临的挑战与改革举措 - 三星半导体在包括HBM、DRAM和NAND闪存在内的所有存储器领域落后于竞争对手 公司内部存在沟通不畅、掩盖问题等削弱竞争力的文化[5][6] - 副会长公开承认公司在早期HBM市场反应迟缓等失误 并承诺在下一代工艺中不会重蹈覆辙[6] - 其最重要的决策之一是对10纳米第四代(1a)DRAM进行全面重新设计 以解决服务器DRAM市场落后及HBM竞争力下降的根源问题 此过程需耗费巨资和一到两年时间[6] - 上任后通过内部公告指出部门间沟通不畅、回避问题的文化以及不切实际的计划等问题 并直面这些难以公开讨论的普遍问题[5][6] 业务复苏与业绩表现 - 管理方法核心是通过明确责任和权力来强化执行力 例如同时兼任DS事业部和存储器事业部负责人 并赋予DRAM开发负责人黄相俊极大权力以提升设计、工程和生产良率[7] - 晶圆代工业务方面 任命韩进万为业务负责人 南锡佑为首席技术官 该策略被证明有效[7] - 过去一年中 三星晶圆代工通过吸引成熟工艺和先进工艺领域的主要客户 稳步解决了长期订单不足和产能利用率下降的问题[8] - 在先进工艺方面 提高了2纳米工艺的良率 与特斯拉签署大额合同 并提高了与AMD合作的可能性[8] - HBM业务准备反弹 第五代HBM3E的8层和12层产品出货量大幅增长 在下一代HBM4研发中取得了超出英伟达和博通等主要客户性能预期的显著成果[8] - 在副会长领导下 三星电子去年第四季度首次创下20万亿韩元的季度营业利润纪录 远超市场预期[8] 未来挑战与可持续性 - 尽管当前改革成效显著 但关于全英贤副会长体系的中长期可持续性存在疑问 目前仍未出现明确的接班人[9] - 随着AI变革席卷全球半导体市场 三星半导体部门的中长期增长前景被认为需要新的领导层[9] - 有观点指出 三星半导体未来的任务是提供涵盖硬件和软件的集成解决方案 并基于现有能力重新定义存储价值 在技术和战略层面实现“超大差距”[9][10]
中国台湾,疯狂补贴芯片设计
半导体行业观察· 2026-01-12 09:31
文章核心观点 - 中国台湾当局通过“晶创台湾方案”推出两项关键补助计划,旨在提升其IC设计产业的全球竞争力,目标是在10年内将IC设计全球市占率从19%提升至40%,并将先进制程市占率提升至80% [1][4] 政策方案与目标 - “晶创台湾方案”首期为期5年,包含由经济部产业技术司主责的“IC设计攻顶补助计划”和由产发署主责的“驱动岛内IC设计业者先进发展补助计划” [1][4] - 方案设定长期目标:10年内将中国台湾IC设计全球市占率从19%提高到40%,其中先进制程市占率要成长到80% [1][4] IC设计攻顶补助计划详情 - 计划由经济部产业技术司主责,2024年推动至今已累计核定补助16件,带动厂商研发投资金额逾182亿元新台币 [2] - 2025年度预算为27亿元新台币,申请受理截止日期为3月31日 [1] - 计划侧重前瞻技术布局,补助范畴锁定在投入足以媲美或超越国际标竿大厂技术指标的芯片设计开发与试产 [1] - 补助目标侧重但不限于卫星通讯、多功能机器人、无人机等芯片与系统开发领域,并对这些领域的提案提供加分鼓励 [1] - 具体补助范畴包括:创新技术的芯片开发、异质整合封装技术之创新芯片、异质整合微机电感测技术的创新芯片开发,以及采用0.35μm(含)以下之晶圆级制程 [1] - 计划采批次收件审查,补助对象以岛内芯片与系统应用业者为主,可由单一或多家企业联合申请,计划时程以不超过2年为原则 [2] - 计划解除7纳米制程以下的限制,并保留“员工加薪规划”要求,对大型企业引进国际人力的比例进行弹性调整,一般希望有10%至20%海外技术人才 [2] 驱动IC设计补助计划详情 - 计划由经济部产发署主责,侧重加速落地应用以形塑韧性供应链,并强化岛内自主芯片设计能力 [1][4] - 2025年度优先支持无人机、机器人与卫星通讯等重点发展领域,受理期限至3月31日止 [4] - 补助范畴分为两类:优势芯片开发(单一申请)每案补助上限2亿元新台币;核心芯片与系统开发(联合申请)每案补助上限3亿元新台币 [4][5] - 系统开发范畴不含无人机领域,优先支持机器人与卫星通讯领域的系统核心芯片与模组或系统开发 [5] - 计划优先支持开发的芯片具体包括:无人机领域的通讯、雷射测距、热像仪及GPS芯片;机器人领域的复合感知、控制、通讯、决策运算、安全感知及雷射测距芯片;卫星通讯领域的Ku band射频、Ka band射频、波束成型及升降频芯片 [5] - 驱动IC设计计划为5年期计划,2024年核定通过28案,共33家厂商参与,补助总金额达13亿元新台币,预计带动250家上下游厂商发展,创造近360亿元新台币产值 [5] - 该计划2024年、2025年经费分别为8亿元、13亿元新台币,2025年规划20亿元新台币经费待立法院审查完成 [5]
SRAM,取代HBM?
半导体行业观察· 2026-01-12 09:31
文章核心观点 - 英伟达收购Groq事件引发了关于SRAM与HBM在AI推理时代技术路线的行业辩论,但“SRAM取代HBM”是一个伪命题,真正的核心是AI推理如何实现总拥有成本最优解[1][22] - SRAM的优势在于确定性、极低延迟和能效,适合边缘计算和实时推理场景;HBM的优势在于大容量和高带宽,仍是数据中心承载海量参数的基石;两者将在AI推理领域并存,形成存储层级化机遇[22][23] SRAM与HBM的技术特性对比 - **SRAM(静态随机存取存储器)**:是世界上最快的存储介质之一,访问延迟为1纳秒,但容量小(几百MB),成本高,面积大;如同“衬衫口袋”,伸手即得但空间有限[2][8] - **HBM(高带宽存储器)**:本质是3D堆叠的DRAM,容量大(几十GB),带宽极高,但访问延迟约为100纳秒;如同“大型仓库”,容量大门宽但存在物理延迟[2] - 两者根本区别在于,SRAM的访问延迟比HBM/DRAM“快一个数量级”(1ns vs 100ns),且具有确定性(每次都一样快)[9][16] AI从训练转向推理带来的存储需求变化 - **训练阶段**:模型参数达百亿甚至千亿级,计算强度高,数据复用率高,对容量和带宽需求大,延迟不敏感,是HBM的舒适区[4] - **推理阶段**:特别是在人机交互和实时控制场景,延迟成为生命线,需要处理Batch Size = 1(单次请求)的实时请求[4] - 传统GPU架构依赖HBM,在实时推理场景中频繁加载权重会导致数百纳秒的延迟,造成性能剧烈下滑,为掩盖延迟被迫增大批处理大小(如256个请求一起处理),导致响应不丝滑[4][7] Groq的LPU架构与SRAM技术路线 - **核心设计**:完全抛弃HBM作为主存储,改用数百MB的片上SRAM存放模型权重,访问延迟仅为HBM的几分之一[10] - **性能数据**:片上SRAM带宽高达80TB/s,在阿贡国家实验室的核聚变反应堆预测任务中,于0.6毫秒内完成了19.3万次推理,比NVIDIA A100性能高出600多倍[10][16] - **架构创新**:采用同步计算与通信方法,将计算与内存访问解耦,实现更高的内存级并行性,支持在Batch Size = 1下提供高性能和可预测的低延迟[11][13][14] - **工艺路线**:当前主要采用台积电14nm/7nm,计划走向4nm,在更先进制程下大规模SRAM的读写稳定性更高[9] 英伟达的视角与行业趋势判断 - **黄仁勋的观点**:承认如果一切都能装进SRAM则不需要HBM,但指出这会使模型尺寸缩小约100倍,成本与电力消耗将是天文数字,因此SRAM无法完全替代HBM[19] - **强调灵活性**:数据中心是有限的电力资源,需要能够灵活切换压力点(NVLink、HBM或计算单元)的架构来应对多变的模型(如MoE、多模态、SSM),以实现总拥有成本最优解[19] - **收购意图**:收购Groq旨在补齐“极致低延迟推理”的拼图,而非全面倒向SRAM;同时,英伟达也在研究通过CPX(计算与存储解耦/压缩)技术减少对昂贵HBM的依赖[18][19][20] - **集成度价值**:高度集成的统一架构(如更新一个模型库可提升所有GPU表现)比拥有17种零散专用架构更能优化整体数据中心的总拥有成本[20] 存储层级化与未来机遇 - **推理的重要性**:训练只发生一次,推理会发生数十亿次,如同“造发动机”与“上路开车”的区别,优化推理体验是“用量起点”[22] - **技术分工**:追求极致速度的边缘侧和特定实时推理场景,SRAM通过ASIC架构蚕食HBM份额;大规模数据中心中,HBM仍是基石;SSD/NAND则负责模型分发与长上下文存储[22] - **投资启示**:不应押注单一技术胜负,而应关注存储层级化带来的全面机遇,SRAM与HBM因其不同特性(快但有代价,慢但能平衡)将在AI推理领域并肩而行[23]
芯片行业,再破纪录
半导体行业观察· 2026-01-12 09:31
全球半导体销售额创历史新高 - 2025年11月全球半导体销售额达到753亿美元,月增3.5%,年增29.8%,连续多月成长并创历史新高 [1] - 此轮增长由所有主要半导体类别需求同步扩张驱动,显示全球芯片市场正进入以人工智能为核心的新一轮长周期扩张 [1] - 单月销售额首次突破750亿美元,显著高于2021年芯片荒期间约550亿美元的高点,较2019年月均350亿至400亿美元的规模几近翻倍 [4] 区域市场表现分化 - **亚太地区**:年增率高达66.1%,月增5%,增幅全球居冠,反映制造产能全面开出与供应链重组效应 [1][2] - **美洲市场**:年增23%,月增3%,AI算力与数据中心投资需求强劲 [1][3] - **中国大陆市场**:年增22.9%,月增3.9%,维持稳健成长,本土化进程加快 [1][2] - **欧洲市场**:年增11.1%,月增1.2%,成长相对温和但保持正向 [1][2] - **日本市场**:年减8.9%,月减0.1%,是主要市场中唯一负增长者,消费电子与车用需求疲弱 [1][3] 亚太地区成为增长核心引擎 - 亚太地区高增长背后是韩国、台湾及东南亚制造产能全面启动 [2] - 三星与SK海力士的高频宽记忆体产线满载运转,相关产能已被提前预订 [2] - 台积电先进制程订单能见度已排至2027年 [2] - 越南、马来西亚、泰国等东南亚新兴制造基地正大量承接封装与测试订单,显示区域半导体供应链正在加速重构 [2] 全产品线需求同步回温 - 逻辑芯片受惠于AI训练与推理需求持续放量 [3] - 高频宽记忆体供给吃紧,带动价格与出货量齐扬 [3] - 类比与功率半导体受工业自动化、新能源车与电力管理需求推升 [3] - 光电元件因数据中心高速互连与感测应用扩张而受益 [3] 产业增长的结构性驱动因素 - **AI算力军备竞赛持续升级**:大型模型、边缘AI与自动化应用持续推升GPU与AI加速器需求 [5] - **数据中心资本支出高档不坠**:全球科技巨头将六至七成资本支出投入数据中心,形成长期订单能见度 [6] - **HBM供给受限带来结构性高毛利**:HBM成为AI效能瓶颈,使具备技术门槛的厂商享有长期定价权 [7] - **消费电子结束去库存周期**:智能手机与PC需求回温,提供产业非AI端的稳定补充动能 [8] - **汽车智能化成为第二成长曲线**:新能源车芯片用量大幅提升,车用半导体成为新一代长线赛道 [9] 市场展望与产业趋势 - 世界半导体贸易统计组织预估,2026年全球半导体销售额有望达到9,754亿美元,年增22.5%,距离年销售额1兆美元仅一步之遥 [5] - 本轮半导体景气最关键的投资讯号在于产业集中化明显加速,具备技术壁垒与规模优势的企业正快速拉开与竞争对手的距离 [9] - 半导体市场已进入“结构性成长搭配高度分化”的新阶段,AI、数据中心与汽车智能化提供了明确的长期方向 [10] 主要市场参与者分析 - **主要受惠者**: - 辉达:AI算力生态系核心,主导GPU与平台标准 [10] - 台积电:先进制程唯一可信赖供应商,订单能见度最长 [10] - 三星、SK海力士:垄断HBM关键供应,毛利结构显著改善 [10] - 博通:AI网络与客制化ASIC需求爆发,角色不可取代 [10] - **相对承压者**: - 英特尔:转型进行中,但AI与制程落后仍限制估值修复 [10] - 美光:HBM布局较慢,短期竞争力受限 [10] - 日本多数芯片厂:终端需求疲弱,错失本轮主升段 [10]