Workflow
半导体行业观察
icon
搜索文档
印度芯片,真干成了?
半导体行业观察· 2025-12-20 10:22
文章核心观点 - 印度半导体产业正从“纯口号阶段”进入真实的产业博弈阶段,其发展路径清晰,即从封装环节切入,逐步向晶圆制造和芯片设计延伸 [1][17] - 苹果与英特尔近期在印度的封装业务布局,标志着印度首次被纳入全球顶级科技公司的供应链候选名单,这是印度半导体发展的一个质变信号 [1][3] - 印度半导体市场的增长潜力巨大,预计将从2023年的约380亿美元增长至2030年的1000亿至1100亿美元,届时消费量有望占全球约10% [1] - 印度的发展模式与中国有相似之处,但基础不同,其优势在于“被需要”以构建更具韧性的全球供应链,而非技术领先 [15][17] 印度半导体市场现状与目标 - 印度半导体市场在2023年价值约为380亿美元,预计到2025年底将增长至450亿至500亿美元,并在2030年进一步扩大至1000亿至1100亿美元 [1] - 印度届时的半导体消费量有望占全球总消费量的约10% [1] - 印度超过90%的半导体需求依赖进口,使其易受供应链中断影响 [11] 苹果在印度的封装业务布局 - 苹果已与印度穆鲁加帕集团旗下的CG Semi进行初步磋商,讨论在印度进行芯片封装以及与iPhone组装相关的合作可能性 [1] - 合作尚处于初期接触阶段,未确定具体封装芯片类型,市场推测可能与显示驱动IC等显示相关芯片有关 [2] - 封装环节技术门槛相对较低、资本密度可控,且易与终端制造协同,是苹果将iPhone生产转移至印度所必需的配套基础设施 [2] - 苹果对供应商的制程稳定性、良率、长期交付能力要求极高,印度厂商被放入候选名单本身已是质变 [3] 英特尔在印度的战略合作 - 英特尔与印度塔塔集团于2025年12月8日宣布建立战略联盟,围绕半导体制造、封装测试以及AI PC解决方案展开合作 [5][8] - 英特尔计划与塔塔电子在其晶圆厂与OSAT工厂中,探索为印度市场生产与封装英特尔产品,并推进先进封装技术的本地化 [8] - 塔塔计划投资约140亿美元在印度建设两座半导体工厂:一座位于古吉拉特邦的晶圆制造厂(预计2027年中期投产),一座位于阿萨姆邦的OSAT工厂(预计2026年投产) [8] - 英特尔以技术顾问角色深度参与,其布局印度封装产能是IDM 2.0战略的一环,看中印度的政策补贴、成本优势和地缘政治“安全属性” [9] 印度半导体计划(ISM)已批准项目 - 印度政府于2021年12月启动印度半导体计划(ISM),耗资100亿美元,旨在构建自给自足的半导体生态系统 [11] - 已批准的主要制造项目包括: - 美光科技在古吉拉特邦萨南德(Sanand)投资约25.6亿美元建设ATMP封装测试工厂 [11] - 塔塔电子与台湾力积电在古吉拉特邦Dholera投资约103.7亿美元建设晶圆厂,月产能50,000片晶圆 [11] - CG Power与瑞萨及Stars在古吉拉特邦萨南德投资约8.66亿美元建设封装厂,产能1,500万颗芯片/天 [11] - 塔塔半导体封装与测试在阿萨姆邦Morigaon投资约30.7亿美元建设封装厂,产能4,800万颗芯片/天 [11] - Kaynes Semicon在古吉拉特邦萨南德投资约3.76亿美元建设封装厂,产能633万颗芯片/天 [11] - HCL-富士康合资企业在北方邦Jewar投资约4.22亿美元建设晶圆厂,月产能20,000片晶圆 [11] - SiCSem Private Limited在奥里萨邦Bhubaneswar投资约5.24亿美元建设工厂,年产能60,000片晶圆(封装9,600万件/年) [11] 印度半导体产业发展路径 - **第一步:封装(OSAT)**:这是当前最明确、推进最快的环节,投资门槛相对低,以成熟工艺为主,与整机制造协同明显,对应中国大陆2005–2015年间的封测扩张阶段 [12] - **第二步:晶圆厂(Foundry)**:以成熟制程为主(如28nm/40nm及以上),多为政府补贴加海外技术合作模式,但量产爬坡周期长(5-8年),且面临人才、良率、供应链完整度等瓶颈 [13][14] - **第三步:设计公司与系统厂**:印度拥有大量IC设计工程师,但多集中于跨国公司研发中心,缺乏完整的本土产品型芯片公司,这是其最有潜力的部分 [14] - 印度首款1.0 GHz 64位双核微处理器DHRUV64的发布,展示了其在芯片设计领域的进展 [14] 印度其他半导体支持计划 - **数字印度RISC-V(DIR-V)计划**:于2022年4月启动,旨在促进印度先进RISC-V处理器的研发,构建共享的设计生态系统 [15] - **芯片到初创企业 (C2S) 计划**:于2022年启动,为期五年,预算25亿卢比,旨在培养85,000名行业所需人才,创建无晶圆厂芯片设计生态系统 [15] - **设计关联激励 (DLI) 计划**:于2021年启动,为期5年,为半导体设计开发和部署提供财政激励和设计基础设施支持 [16] - **印度纳米电子用户计划——从构想到创新(INUP-i2i)**:为研究人员、学生和初创企业提供使用国家纳米制造设施的机会,提供芯片制造实践培训 [16] - 截至2025年7月,印度电子信息技术部已批准23个芯片设计项目,批准预算达80.3亿印度卢比,提供高达50%的成本补贴(上限1.5亿卢比)和为期五年、净销售额4%至6%的奖励(上限3亿卢比) [17] 印度半导体产业的优劣势 - **优势**:产业因“被需要”而发展,全球客户希望印度能提供更具韧性的供应链;拥有政策补贴和成本优势;拥有大量IC设计工程师储备 [15][17] - **劣势**:基础设施不足,如对超纯水和稳定电力的需求构成障碍;晶圆厂建设成本高昂,私人投资难;微电子和材料科学领域专业人才短缺;制造业生态和市场规模基础不及当年的中国 [15][17]
英特尔晶圆代工,命悬一线
半导体行业观察· 2025-12-20 10:22
文章核心观点 - 英特尔已开始大规模生产其先进的18A制程芯片,旨在扭转落后于台积电的局面,但其代工业务面临的最大挑战是吸引大型外部客户[1] - 英特尔在经历了市值暴跌、技术延误和错过移动与AI革命后,正通过新建工厂、获得政府与产业投资、更换管理层及改变企业文化等方式试图复兴[6][11][13] - 全球地缘政治因素,特别是先进芯片制造高度集中于台湾,推动了美国政府对英特尔的支持,使其复兴承载了更广泛的产业与国家安全意义[13] 英特尔18A制程的现状与挑战 - 18A制程已在其亚利桑那州的新工厂Fab52实现量产,每周可启动超过1万片18A晶圆[9] - 18A在某些指标上与台积电2nm工艺不相上下,但生产初期面临良率问题,导致每片晶圆的可用芯片数量降低[2] - 该制程采用了RibbonFET全包围栅极架构,相比英特尔3代处理器,每瓦性能提升15%以上[10] - 英特尔最大的优势之一是其先进的封装技术,有助于缓解芯片功耗问题[10] - 目前英特尔18A制程的主要客户是其自身,首款主要产品为计划于明年1月上市的酷睿Ultra系列3 PC处理器(代号Panther Lake)[1] 代工业务与客户拓展 - 英特尔代工业务(IFS)在2021年后重新聚焦,但尚未获得任何大型外部客户[3] - 吸引客户的主要障碍在于:许多公司已为保障良率和产能在台积电投入巨资;英特尔自身也生产芯片设备,与潜在客户存在竞争关系[1][12] - 公司正积极改变企业文化以提升执行力,并将寻找代工厂客户作为首要任务[9] - 已获得微软和亚马逊的早期协议,承诺使用其代工厂生产部分内部定制芯片,但销量相对较小[12] - 近期有报道称AMD正考虑在英特尔生产,并有分析师预测苹果可能在2027年再次使用英特尔生产部分Mac芯片[13] 公司近期财务与战略调整 - 2024年是英特尔有史以来最糟糕的一年,市值缩水约60%[6] - 新任CEO Lip-Bu Tan于2024年3月上任,采取了更审慎的财务策略,强调“不再开空白支票”,公司需要客户[11] - 为此,公司大幅削减成本,裁员15%,并取消了在德国和波兰的项目,同时推迟了俄亥俄州新厂的投产时间至2030年[11] - 公司获得了来自美国政府89亿美元的投资(占股10%)以及英伟达50亿美元的投资,尽管英伟达未承诺使用其代工厂[3][5] 历史背景与衰落原因 - 英特尔由罗伯特·诺伊斯、戈登·摩尔等人于1968年创立,曾是全球最大、最赚钱的半导体公司[6] - 衰落始于错过了移动革命(如拒绝为初代iPhone生产处理器)和人工智能革命,其GPU竞争项目也告失败[6][8] - 技术延误是关键:其10纳米和7纳米制程工艺被推迟数年,部分原因可能是早期暂缓使用ASML昂贵的极紫外(EUV)光刻设备[6] - 到2021年,台积电已成为制程节点领导者,英特尔开始将部分尖端芯片生产外包给台积电,同时苹果也开始用自研的台积电生产芯片替换Mac中的英特尔芯片[7] 制造设施与运营 - 英特尔位于亚利桑那州钱德勒的园区现有五个芯片制造厂,通过30英里的架空轨道连接,第六个晶圆厂Fab62预计2028年左右建成[9] - Fab52是最新加入的工厂,拥有超过100万平方英尺的洁净室制造空间[5][9] - 该工厂至少配备了15台EUV光刻机[6] - 在可持续运营方面,亚利桑那州工厂几乎100%使用可再生能源,2024年用水量超过30亿加仑,并通过循环利用将24亿加仑水回馈给当地供水系统[10] 地缘政治与行业意义 - 美国政府通过《芯片和知识产权法案》向英特尔投资89亿美元,表明其对在美国本土重建领先半导体制造能力的信心与支持[5][13] - 全球约92%的先进芯片产自台湾,这种集中度被视为全球供应链的重大风险[13] - 英特尔的复兴被赋予了超越商业的意义,被视为确保美国在半导体领域领先地位和降低地缘政治风险的关键[13]
粤芯,冲刺科创板
半导体行业观察· 2025-12-20 10:22
IPO基本信息 - 粤芯半导体技术股份有限公司的创业板IPO申请于2025年12月19日正式获深交所受理 [1][2] - 本次IPO拟募集资金75亿元人民币,保荐机构为广发证券 [1][2] - 公司是专注于模拟和数模混合特色工艺的晶圆代工企业,客户涵盖境内外多家头部半导体设计企业,产品应用于消费电子、工业控制、汽车电子和人工智能等领域 [2] 财务与经营状况 - 公司是深交所受理的第二家未盈利企业 [3] - 2022年至2025年上半年营业收入分别为15.45亿元、10.44亿元、16.81亿元和10.53亿元人民币 [3] - 2024年营业收入较2023年增长61.09%,2025年上半年较去年同期持续实现大幅增长 [3] 技术与产品布局 - 公司致力于提供12英寸晶圆代工服务和特色工艺解决方案,截至2025年6月30日,已取得授权专利681项,其中发明专利312项 [4] - 已构建完整的“感知-传输-计算-存储-控制-显示”全链路技术矩阵,在指纹识别芯片领域是全球出货量领先的电容指纹识别芯片晶圆代工厂之一 [5] - 在显示驱动芯片领域,2024年公司高压显示驱动芯片12英寸晶圆出货量排名中国大陆晶圆厂第三名 [5] - 在硅光芯片领域取得重大突破,是国内少数拥有12英寸硅光芯片工艺技术平台的晶圆代工厂之一,2024年底成功推出12英寸90nm SiPho工艺技术平台并进入试生产阶段,同时积极开发65nm SiPho工艺制程 [6] - 是国内极少数能够同时提供“集成电路、功率器件、光电融合”三位一体代工服务的集成电路制造企业 [6] 战略规划与募资用途 - 上市目的是为了强化技术优势,加速从消费级晶圆代工向工业级、车规级工艺迭代,深度布局人工智能、端侧存内/近存计算等领域的特色工艺 [5] - 目标是实现从“纯模拟代工”向“以模拟为核心,以数模混合为蝶变,以光电融合为特色”的复合型技术平台转型 [5] - 本次IPO募集的75亿元资金,除了扩充产能,主要将投向特色工艺技术平台研发项目,具体包括基于65nm逻辑的硅光工艺及光电共封关键技术研发项目、基于eNVM工艺平台的MCU关键技术研发项目、基于22nm逻辑和RRAM存储器件工艺技术的存算一体芯片研发项目 [5] 市场地位与行业影响 - 公司是广东省自主培养且首家进入量产的12英寸晶圆制造企业,实现了广东省12英寸芯片制造从0到1的突破 [7] - 对粤港澳大湾区集成电路的产业发展、产业升级和产业安全具有重要意义 [7] - 公司的转型与上市有利于完善大湾区“设计-制造-封装测试”的集成电路产业链闭环,为设备、材料、EDA等上下游领域的国产化提供重要“演练场” [7] - 在硅光领域,根据Yole预测,2029年全球硅光光模块市场规模预计将达102.60亿美元,2023年至2029年年均复合增长率接近40%,市场空间巨大 [6]
存储市场需求,吓人
半导体行业观察· 2025-12-20 10:22
文章核心观点 - 人工智能数据中心建设热潮正显著推高对高性能内存和存储的需求,特别是HBM(高带宽内存)市场,其潜在市场规模(TAM)预测被大幅上调,增长曲线变得更为陡峭 [1][2] - 美光科技作为关键的内存供应商,其财务业绩和资本支出计划反映了行业需求的强劲以及供应紧张带来的价格优势,公司正加速产能扩张以抓住市场机遇 [3][10][11] - 基于美光科技更新的HBM市场预测,未来几年人工智能相关硬件(包括GPU/XPU和整个AI系统)的销售收入预期也相应被大幅调高 [7] 行业需求与市场预测 - 人工智能数据中心容量增长是高性能内存和存储需求的主要驱动力,预计2025年服务器销量增长率将接近10%,且强劲需求将持续至2026年 [2] - 预计2025年DRAM行业比特出货量将增长约20%,NAND出货量增长10%以上;2026年两者出货量预计均比2025年增长约20% [3] - HBM市场规模预测被大幅上调:2024年12月预测显示,HBM市场收入将从2025年的350亿美元增长至2030年的1000亿美元,复合年增长率(CAGR)为23.2% [5][6] - 2025年12月的最新预测将市场规模达到1000亿美元的时间从2030年提前至2028年,这意味着从2025年到2028年的复合年增长率将超过40% [5][6] - 根据新的预测,假设2029年和2030年增长率放缓,未来六年(2025-2030)HBM总收入预计将达到5550亿美元,比旧预测的3780亿美元高出46.8% [7] 美光科技财务与运营表现 - 2026财年第一季度(截至11月),公司销售额为136.4亿美元,同比增长56.7%;营业收入61.4亿美元,净收入52.4亿美元,均同比增长2.8倍 [10] - 当季DRAM收入为108.1亿美元,同比增长68.9%;NAND闪存相关收入为27.4亿美元,增长22.4% [13] - 数据中心业务总收入为76.6亿美元,同比增长55.1%;营业收入为37.9亿美元,几乎是去年同期的两倍 [16] - 云内存业务收入为52.8亿美元,同比增长99.5%,毛利率达66%,营业利润率达55% [14] - 移动与客户端业务收入为42.6亿美元,同比增长63.2%,营业利润率从去年同期的20%提升至47% [14] - 汽车与嵌入式业务收入为17.2亿美元,同比增长48.5%,营业利润率从去年同期的11%提升至36% [14] - 公司2026财年第一季度资本支出为54亿美元,同比增长1.7倍;计划将2026财年总资本支出增加20亿美元至200亿美元 [3][11] - 季度末现金储备为103.2亿美元 [11] 产品细分与市场动态 - 美光科技数据中心NAND存储业务在2026财年第一季度首次突破10亿美元大关 [2] - HBM堆叠式内存、高容量服务器DRAM以及LPDDR5内存的总销售额达到56.6亿美元,略高于DRAM总销售额的一半,同比增长超过5倍 [16] - 据估算,高容量服务器DIMM和LPDDR5内存贡献了约14亿美元的营收,同比增长3.7倍;HBM内存贡献了约42.7亿美元的营收,同比增长5.7倍 [18] - 英伟达在本季度贡献了23.2亿美元的收入,占美光总收入的17%,是去年同期支出的两倍 [18] - 在2026财年第一季度,DRAM的每比特成本上涨了20%,而NAND的每比特成本上涨了约15% [3] 产能扩张计划 - 为满足1γ DRAM和HBM的供应需求,美光正加快设备订购和安装速度 [3] - 位于爱达荷州的首座晶圆厂将于2027年中期投产;第二座晶圆厂将于明年开工建设,2028年底投入运营 [3] - 位于纽约的首座晶圆厂将于2026年破土动工,2030年开始供应芯片 [3] - 位于新加坡的HBM封装厂将于2027年投产 [3] 产业链影响估算 - 假设美光科技获得约25%的HBM市场份额(与其当前DRAM份额相近),根据旧预测,未来六年(2025-2030)其HBM收入约为950亿美元;根据新预测,其HBM收入约为1390亿美元 [7] - 假设HBM内存成本约占GPU/XPU计算引擎成本的40%,那么根据新预测的5550亿美元HBM收入,将带动GPU/XPU计算引擎的生产收入达到约1.4万亿美元 [7] - 进一步假设加速器成本约占服务器系统成本的65%,那么AI系统销售额将达到约2.1万亿美元 [7]
半导体材料,不容忽视
半导体行业观察· 2025-12-20 10:22
文章核心观点 半导体先进封装技术正从2D向3D集成和大尺寸基板演进,材料的作用已从结构支撑转变为决定器件性能与可靠性的关键因素[1] 行业面临新型材料缺乏长期可靠性数据、工艺窗口狭窄、多材料界面相互作用复杂等挑战[1][2] 为应对挑战,行业正转向系统级的材料-工艺协同优化策略,将材料选择、工艺控制和界面工程视为统一整体进行设计,以提升封装良率、性能和长期可靠性[12][15] 半导体先进封装材料的角色转变与核心挑战 - 材料角色发生根本性转变:从提供结构支撑和电绝缘,转变为限制器件性能的关键因素[1] - 现代封装包含更多新型材料:包括聚合物、粘合剂、先进介电材料、导热材料和复合材料层压板[1] - 核心挑战在于材料新颖性:许多新材料缺乏足够的长期可靠性数据,某些失效模式仅在现场循环或板级组装后才会显现[1][2] 新型材料需求与可靠性风险 - 3D架构与高频AI应用驱动新材料需求:需要具有特定介电常数/损耗角正切值(Dk/Df)的介电材料,以及应对千瓦级功率密度的新型导热界面材料和冷却方案[1] - 材料种类增加带来不确定性:新材料与基材、再分布层等的相互作用可能产生前所未见的、难以建模的失效特征[2] - 失效模式具有延迟性:包括粘合力丧失、聚合物固化后松弛、吸湿溶胀或材料迁移等,可能在长期使用、热循环或下游工艺后出现[2] - 材料需具备精确调控特性:现代系统要求材料具备精确的介电性能、可控的流动固化特性及可预测的热机械应力行为[2] 界面、薄膜与工艺控制的关键性 - 界面问题成本高昂:在流程后期发现界面问题会造成巨大损失,需在早期将材料作为系统进行协同设计[3] - 超薄膜对工艺高度敏感:表面粗糙度、残留污染物和图案形貌会影响成核、生长模式和应力,使材料性能超出安全范围[4] - 初始表面条件至关重要:表面的清洁度和轮廓决定了薄膜的沉积方式,腔室温度和初始表面影响堆叠结构的最初几个埃,进而影响粘附机制和薄膜应力[4] - 需在亚纳米尺度进行控制:通过精确控制成分和厚度来拓宽工艺宽容度,稳定界面并减少后续步骤偏差[4] - 沉积工艺引入薄膜应力:沉积材料时会引入薄膜应力导致衬底翘曲,需通过调整工艺参数或采用应力补偿策略来最小化影响[6] 大尺寸面板带来的机械与热管理挑战 - 面板尺度放大机械效应:大尺寸基板会放大残余应力、应变状态差异和局部图案密度的影响,机械稳定性成为动态目标[5] - 热机械耦合问题突出:高功率密度导致热响应与机械响应耦合,热点会局部软化聚合物,加速蠕变或应力松弛[7] - 散热成为集成密度限制因素:高密度集成的绝缘材料阻碍热流,加剧热梯度,影响长期机械稳定性[7] - 功率密度目标推动材料创新:行业目标散热功率达3000瓦,需要高功率散热材料以及能控制翘曲的高热膨胀系数、低固化时间材料[9] 导热界面材料(TIM)的核心作用与优化 - TIM是热管理关键:界面热阻取决于润湿性、空隙倾向和键合层厚度,同时TIM也影响应力分布[9] - 空隙最小化至关重要:TIM中的空隙会显著阻碍导热,导致热点,降低器件可靠性[9] - 需与功耗图匹配:TIM的选择需基于器件的实际功耗图,以实现最佳热管理[11] - 低介电常数材料的两难:从电学角度需要低介电常数以降低耦合,但从热学角度,许多低介电常数材料导热性差,会加剧温度梯度[9] - 需控制系统变量:需将TIM配方、金属化、盖板设计和组装方式与器件实际功率分布图匹配,形成降低热阻、稳定温度的良性循环[10][11] 行业应对策略:材料-工艺协同优化 - 转向系统级方法:将材料、工艺和工具视为统一系统进行协同优化,拓宽安全工艺窗口[12][15] - 依赖原子层沉积(ALD)等先进技术:ALD技术能实现极高的均匀性和一致性,对于环绕栅极等先进技术至关重要[13] - 加强界面工程:在紧凑几何结构下,导体选择也成为界面问题,去除不必要的衬垫和阻挡层可以降低电阻和焦耳热,减轻热机械应力[14] - 利用建模与仿真:通过虚拟方式探索沉积过程在复杂3D几何形状中的情况,在特征尺度模拟应力影响,精度需达到纳米甚至埃级[4][12] - 形成数据闭环:利用数据及早控制变异性,使材料可靠性成为可控参数,而非验证后期才发现的问题[14][15]
颠覆冯·诺依曼架构,这款AI处理器能效提升100倍!
半导体行业观察· 2025-12-20 10:22
文章核心观点 - 一家名为Efficient Computer的初创公司推出了一款名为Electron E1的通用处理器,其采用的专有“Fabric”空间数据流架构,据称是传统冯·诺依曼架构的真正替代方案,能够在执行通用代码的同时,显著降低能耗,尤其适用于边缘AI和嵌入式应用 [1][4][5] 产品与技术架构 - 产品名称为Electron E1,是一款通用处理器,旨在直接在设备上运行高级信号处理和AI推理 [1] - 核心技术是名为“Efficient Fabric”的专有空间数据流架构,通过将操作映射到计算单元网格上,仅在输入可用时激活单元,从而大幅减少传统冯·诺依曼架构中内存与计算核心间的数据移动,这是能效提升的关键 [1][4] - 该架构保持了计算的通用性,能够支持应用程序运行所需的所有代码,包括传感器融合、DSP压缩、加密和嵌入式Transformer等一系列辅助功能,而不仅仅是单一类型的计算 [1][4][5] 性能与规格 - 与Arm Cortex-M33和Cortex-M85等传统低功耗处理器相比,其能效声称可提升**100倍** [1] - 处理器包含**128kB**超低功耗高速缓存、**3MB SRAM**和**4MB MRAM**用于非易失性存储 [2] - 性能方面,在高压模式**200MHz**下可达**21.6 GOPS**,在低压模式**50MHz**下可达**5.4 GOPS** [2] 目标市场与应用场景 - 目标应用领域包括边缘计算、嵌入式系统和人工智能应用,特别适用于电力受限、需要长电池续航的设备,如无人机和工业传感器 [5] - 公司正与BrightAI合作进行首次实际部署,使BrightAI的设备能够在边缘端处理实时AI计算,减少对高能耗云计算的需求,旨在提高关键基础设施的可观测性 [5] - 公司在机器人、汽车、航天和国防等对尺寸和功耗有严格要求的应用领域看到了巨大的发展势头 [5] 公司背景与产品发布 - 创始团队在卡内基梅隆大学相识,Electron E1技术是与该大学合作十年的研究成果 [6] - 公司近期已面向早期开发者和云端用户发布了Electron E1评估套件(EVK),这是一个完整的即用型平台,用于创建、测试和优化软件 [6] - 公司宣称其目标是将世界带入“后冯·诺依曼通用计算时代”,实现更通用、更快、能耗更低的计算 [6]
收紧!台积电出口禁令或将升级
半导体行业观察· 2025-12-20 10:22
文章核心观点 - 中国台湾地区正考虑制定更严格的半导体技术出口管制规则 即“N-2规则” 以限制台积电等企业向海外出口最先进的芯片制造技术 此举旨在维护台湾在半导体领域的领先地位 并可能影响台积电在美国的扩张计划 [1][3] 潜在政策变化:从“N-1”到“N-2” - 台湾地区正考虑将现行的“N-1规则”升级为更严格的“N-2规则” [3] - “N-1规则”允许出口落后台湾领先制造工艺至少一代的技术 而“N-2规则”仅允许出口落后领先技术两代的技术 [3] - 根据对“代”的不同计算方式 新规则意味着台积电可能只能出口落后其最先进技术两到四年的工艺节点 [3] - 举例说明:若台积电在台湾开发出1.2nm或1.4nm工艺 则只有其1.6nm级产品才有资格在海外使用 [3] 对台积电美国工厂的影响评估 - 台积电位于美国亚利桑那州的Fab 21一期工厂目前生产N4/N5工艺芯片 从形式上看已符合“N-2规则” [4] - 然而 计划于2027年投产的Fab 21二期工厂将采用3nm级(N3)工艺生产芯片 [4] - 若将N2/N2P/A16视为新一代技术 则N3工艺仅落后一代 这将使二期工厂不符合“N-2规则” [4] - 但若将采用背面供电网络的A16视为全新一代产品 那么二期工厂将符合新的出口框架 [4] - 该政策若实施 可能会减缓台积电在美国的扩张步伐 因为公司目前主要依靠在美国积极建设先进的晶圆厂 [1] 台湾地区的配套监管措施 - 台积电的大部分研发人员仍留在台湾 公司的研发布局符合政府要求 [4] - 工程师和科学家的集中部署确保了未来的工艺开发能够扎根于台湾本土 [4] - 半导体行业所有合格人员均受监管 这保护了知识产权、硬件以及人力资本 [4] - 台积电未来在美国的任何投资都将按照现行法律进行审查 超过一定门槛的项目必须由投资委员会进行审查 [5]
非GPU赛道,洗牌
半导体行业观察· 2025-12-20 10:22
文章核心观点 - 全球算力市场长期由英伟达GPU垄断的格局正在松动,非GPU芯片势力崛起已势不可挡 [1][2][6] - 全球算力产业正朝着打破单一架构、不同技术路径百花齐放的局面发展,GPU与非GPU路线将并行发展 [9][10][11] - 非GPU路线在成本、能效比、场景适配性上更契合当下AI主流应用场景,尤其在推理领域增长潜力强劲,中国市场渗透率领先全球 [15][16][21] - 在非GPU技术路线中,可重构计算路线因能兼顾灵活性与高能效比,发展势头迅猛,有望实现对国际主流芯片的弯道超车 [24][32][33] 全球算力产业格局变革 - 近期海内外算力产业密集事件频发,共同指向英伟达GPU垄断格局松动 [2] - 海外方面,谷歌TPU获得Anthropic价值约1486亿元人民币的订单,英特尔计划以约112.9亿元人民币收购SambaNova,Groq两年融资超213亿元人民币 [2][3][5] - 国内方面,沐曦股份科创板上市首日午盘大涨687.79%,总市值达3298.82亿元;清微智能获得超20亿元融资;国内AI芯片创企密集披露并购、上市计划 [1][2] - 2025年上半年,中国非GPU服务器市场占比已达30%,预计到2028年将接近50% [16] - 驱动变革的核心维度包括:需求端推理场景算力需求增加及行业需求多元化;技术端需突破传统架构瓶颈;生态层面需打破单一架构垄断 [8][9] 非GPU技术路线分析 - **ASIC路线**:代表企业包括谷歌、亚马逊云科技、寒武纪、昆仑芯 [5][30] - 核心优势在于性能、功耗及支持深度定制,例如寒武纪思元370算力达256TOPS,是前代产品2倍;昆仑芯R200性能可达主流GPU的1.5倍 [30] - 不足在于研发周期长、成本高,且硬件一旦固化难以适应算法快速迭代 [31] - **可重构计算路线**:代表企业包括清微智能、SambaNova、Groq [5][32] - 核心优势在于硬件架构可随算法需求动态适配,兼顾灵活性与高能效比 [36] - 相比行业同类型产品,可实现成本整体降低50%、能效比提升3倍 [32] - 清微智能可重构芯片累计出货量已超3000万颗,2025年算力卡订单累计超3万张,在全国十余座千卡规模智算中心落地 [32] - 其自研TSM-LINK算力网格技术支持多芯片点对点直连,能规避传统交换机的带宽瓶颈与延迟问题 [33] 技术路线对比与发展趋势 - **GPU路线**:优势在于通用性强、生态成熟,在通用大模型训练、图形渲染等场景地位稳固,但面临功耗高、成本高、算力利用率较低及“内存墙”限制等挑战 [11][36][39] - **非GPU路线**:优势在于能效比高、全生命周期成本低、场景适配性强,更契合AI推理、边缘计算等主流应用场景,但生态成熟度与软件工具链尚不及GPU [21][22][39] - 两条路线并非简单替代关系,而是各有优劣,将并行发展 [11][23] - 全球算力产业重心正从唯硬件性能论,转向软件、模型、场景适配的全栈协同布局,以实现算力效能最大化 [12] - 中国厂商在非GPU赛道竞争力提升,话语权正在增强 [13] 国内头部芯片企业布局 - 北京AI核心产业规模已达近3500亿元,占全国近一半,其芯片代表企业昆仑芯、寒武纪、摩尔线程、清微智能的发展是产业缩影 [25] - 四家企业中,摩尔线程为GPU阵营,寒武纪、昆仑芯主攻ASIC路线,清微智能发力可重构计算路线 [29] - 可重构计算路线发展势头更猛,因其解决了GPU低效和ASIC固化的痛点,更契合AI产业向场景细分转型的趋势 [32] - 清微智能下一代芯片有望带来大幅度性能跃升,实现对国际主流前沿AI芯片的弯道超车 [33]
万字拆解371页HBM路线图
半导体行业观察· 2025-12-19 17:47
文章核心观点 - 高带宽内存是AI算力发展的关键基础设施,其性能直接决定了AI模型训练和推理的速度与效率[1] - 韩国KAIST大学发布的HBM技术路线图详细规划了从2026年HBM4到2038年HBM8的完整发展蓝图,揭示了未来十年HBM技术的演进方向[1] - HBM通过3D堆叠等核心技术,在带宽、功耗和体积上相比传统内存具有压倒性优势,已成为AI服务器的必需品[7][11][14] HBM技术定义与核心优势 - HBM是一种专为AI设计的“超级内存”,采用“三明治式”3D堆叠技术,将8-24层核心芯片垂直堆叠,通过硅通孔连接,解决了传统内存的“平面布局”缺陷和数据传输瓶颈[7][8] - HBM相比传统DDR5内存具有三大核心优势:带宽极高、功耗更低、体积迷你[11] - **带宽碾压**:HBM3带宽为819GB/s,HBM4将达2TB/s,HBM8更将飙升至64TB/s,是HBM3的78倍,能满足未来万亿参数AGI的需求[12][56] - **功耗减半**:传输1TB数据,HBM3功耗是DDR5的60%,HBM4能降至50%,可为数据中心节省巨额电费[13] - **体积小巧**:HBM直接集成在GPU封装旁,传输距离从厘米级缩短至毫米级,使AI服务器算力密度提升3倍[10][14] HBM技术发展路线图(2026-2038) - **2026年:HBM4——定制化首秀** - 核心创新在于定制化Base Die,可集成内存控制器并直接连接低成本、大容量的LPDDR内存,作为“备用仓库”[9][22] - 带宽从HBM3的819GB/s提升至2TB/s,单模块容量达36-48GB,是HBM3的2倍[22] - 采用直触液冷散热方案以应对75W的高功耗[24] - 主要面向中端AI服务器、高端游戏显卡等场景[26] - **2029年:HBM5——近内存计算崛起** - 核心创新是引入近内存计算,在内存堆叠中集成NMC处理器和L2缓存,使内存具备计算能力,可将LLM推理中GPU的工作量减少40%,速度提升1.5倍[27][28] - 带宽提升至4TB/s,单模块容量80GB,功率100W[27] - 采用浸没式冷却散热,并集成专用去耦电容芯片以稳定供电[28][29] - 主要面向超算中心、大模型训练集群等场景[31] - **2032年:HBM6——多塔架构优化高吞吐量** - 核心创新是“四塔”结构,在一个Base Die上放置两个独立的Core Die堆叠,使吞吐量比HBM5提升126%[36][38] - 带宽达8TB/s,数据速率提升至16Gbps,单模块容量96-120GB,功率120W[35][36] - 采用硅-玻璃混合中介层以降低成本20%,并集成L3缓存专门存储LLM推理中的KV缓存,减少HBM访问次数73%[38][40] - 主要面向LLM推理集群、实时AI翻译等高吞吐量场景[40] - **2035年:HBM7——内存与闪存融合** - 核心创新是整合高带宽闪存,形成“内存+闪存”协同方案,HBM存高频数据,HBF存低频大容量数据,使系统总容量可达17.6TB,成本比全用HBM降低60%[41][42][46] - 带宽提升至24TB/s,数据速率24Gbps,单模块容量160-192GB,功率160W[44][46] - 支持3D堆叠LPDDR以拓展边缘计算场景,并采用嵌入式液冷散热[46][47] - 主要面向多模态AI系统、自动驾驶中央计算单元等场景[48] - **2038年:HBM8——全3D集成终极形态** - 核心创新是全3D集成技术,通过铜-铜直接键合将GPU裸片垂直堆叠在HBM之上,使数据传输延迟突破1纳秒,I/O功耗降低70%[54] - 带宽达到64TB/s,数据速率32Gbps,单模块容量200-240GB,功率180W[36][56] - 采用双面中介层设计,使单GPU搭配的HBM容量再提升50%,并应用双面嵌入式冷却进行精准温控[56][57] - 专为未来AGI原型机设计,标志着计算架构进入“立体共生”时代[52][60] 支撑HBM性能的三大关键技术 - **硅通孔**:在芯片上制造垂直微孔道,让数据直接在堆叠层间穿梭,传输路径缩短90%以上,是实现3D堆叠的基础[59][67] - **混合键合**:采用铜-铜直接键合工艺替代早期的微凸点连接,使连接电阻降至原来的1/10,实现了更高密度(单片10万个连接点)和更可靠的芯片堆叠,支撑HBM8达到16384个I/O[68][70][71] - **AI辅助设计**:利用AI模型大幅提升HBM复杂结构的设计效率,如PDNFormer模型可在1毫秒内完成电源阻抗分析,Mamba-RL算法可在20分钟内优化去耦电容布局,将设计周期从半年缩短至两周[72][74][76][79] HBM产业格局与市场前景 - 全球HBM市场呈现寡头垄断格局,SK海力士、三星、美光三家公司垄断了90%以上的产能,订单已排至2026年[80][81] - SK海力士为行业龙头,HBM3E良率达90%,占据全球55%的HBM3E出货量,其M15X新工厂投产后月产能将从10万片提升至17.8万片[81] - 三星的HBM3E产能已被谷歌、博通、亚马逊等头部客户包圆,并与OpenAI签订了价值713亿美元的四年供应大单[84] - 美光增速最快,其HBM3E已通过英伟达认证,目标是在2026年将市场份额从7%提升至24%[85] - 2025年全球HBM市场规模已达300亿美元,预计2030年将突破980亿美元,占据整个DRAM市场的50%[80] HBM未来发展的主要挑战 - **成本挑战**:HBM3每GB成本约为DDR5的5倍,HBM4因工艺复杂成本预计再增30%,需通过提升良率(目标95%以上)、扩大产能、技术创新(如采用玻璃中介层)来构建降本体系[86] - **散热挑战**:未来HBM8功率可能突破200W,需研发新型高热导率冷却材料、采用芯片级冷却方案(如集成微型散热鳍片)以及智能温控系统来应对[87] - **生态协同挑战**:需要GPU/CPU厂商优化硬件接口,AI框架针对近内存计算特性优化算法,并推动行业制定统一标准,以降低应用门槛并实现性能最大化[87]
光芯片,卷土重来
半导体行业观察· 2025-12-19 09:40
文章核心观点 - Q.ANT公司推出了第二代原生光子处理单元,实现了从光加速到全非线性光子处理的技术飞跃,旨在突破传统硅基芯片在人工智能和高性能计算领域的物理与能耗限制 [1][7] - 第二代NPU通过原生非线性光处理能力,显著提升了AI模型的精度与效率,同时大幅降低了能耗和热量产生,为边缘计算和科学计算等场景提供了新的硬件路径 [1][4][6] - 该技术以即插即用的服务器形式交付,兼容现有数据中心基础设施,有望快速部署并支持广泛的AI与HPC算法,展示了光子计算架构超越传统CMOS发展速度的潜力 [1][7] 技术演进与产品迭代 - 第一代NPU证明了光可作为实用的计算介质,专注于利用光进行高精度线性代数运算以提升推理效率 [1][2] - 第二代NPU的核心突破在于增加了重新设计的非线性光学核心,能够以单次光学运算处理类似神经网络激活函数的运算,突破了第一代仅支持线性运算的限制 [1][2] - 技术平台核心仍为薄膜铌酸锂光子芯片,但第二代产品扩展并提升了模拟性能,通过在光子电路内部执行非线性运算,避免了与电子元件反复交换数据带来的瓶颈 [2] - 在短短两年内,Q.ANT的NPU性能进步赶上了标准数字处理器过去30年的发展 [4] 性能优势与关键技术指标 - 能耗最多可降低30倍,针对特定AI和HPC工作负载的性能最高可提升50倍 [6] - 光子运算具有极高带宽,并可同时处理多个波长,能够处理传统数字流水线无法处理的数据流 [6] - 增强的非线性模块使神经网络能够以更少的参数、更低的计算深度实现更高的精度,尤其在图像学习和基于物理的任务中表现显著 [2] - 系统以极低的能耗执行运算,几乎不产生热量,并大幅减少了通常用于数据传输的能量消耗 [4] 产品形态与系统集成 - 第二代产品不再以独立PCIe卡形式推出,而是封装成完整的19英寸机架式服务器,可直接安装到HPC和数据中心机架 [1][2] - 每个服务器机箱包含多个第二代NPU、一个集成x86主机处理器和Linux操作系统,无需对现有工作流程进行改动 [1][2] - 提供C、C++和Python API,与现有HPC和AI框架保持兼容,同时其光子算法库提供针对光学硬件优化的非线性函数 [4] 应用场景与市场潜力 - 视觉系统(如质量检测、机器人和物流)有望率先受益,光子处理器可使更智能的视觉系统以更低功耗在边缘部署成为可能 [6] - 科学计算工作负载(如材料研究、气候模拟、聚变研究或药物研发中使用的基于物理的模型)将受益于NPU能以光学方式运行非线性步骤 [6] - 公司将在2025年超级计算大会上展示演示,使用小型非线性网络在几秒钟内学习图像,表明平台正快速超越其早期原型 [6]