Workflow
半导体行业观察
icon
搜索文档
DDR 5,开始降价了
半导体行业观察· 2026-03-17 10:27
DDR5内存价格近期动态 - 全球DRAM短缺已持续数月,DDR5内存套装价格曾稳定在危机前的4-5倍左右,但不同地区价格走势出现分化,部分上涨,部分小幅下降 [2] - 根据德国零售市场数据,2026年3月是自2025年7月以来DDR5内存价格唯一出现下降的月份,价格指数环比下降7.2%,从440%降至408% [2][5][6] - 尽管3月价格下降,但DDR5内存的平均价格仍比2025年7月的基准水平高出近440%,目前价格约为基准价格的4.1倍 [5][6] DDR5内存价格历史走势 - 以2025年7月价格为基准(100%),DDR5价格在后续月份持续上涨:10月上涨15.8%,11月大幅上涨49.5%,12月涨幅高达93%,2026年1月上涨27.6%,2月价格保持稳定,3月则出现7.2%的下降 [4][5] - 从2025年7月至2026年3月,追踪的20款DDR5产品价格指数累计上涨了308%,部分具体产品涨幅巨大,例如8GB DDR5/5600套装上涨了350%,32GB DDR5/5600套装上涨了355% [5] - 2026年3月,不同规格DDR5产品价格变化各异,其中2x32GB DDR5/6000 CL28套装价格环比降幅最大,达到19%,从999欧元降至805欧元;而2x32GB DDR5/5600套装价格则基本持平 [5][6] 其他存储产品市场状况 - 与DDR5价格下降趋势不同,旧款DDR3和DDR4内存价格在2026年3月保持稳定,仅小幅上涨0.8%,其价格水平仍比2025年7月基准高出237% [7] - SODIMM移动内存市场价值在3月下降了4.6%,主要原因是4GB DDR4内存模块的价格从2月份不合理的高位进行了调整 [7] - 存储市场呈现矛盾趋势:内置固态硬盘(SSD)价格在3月平均上涨了3.4%,其中1TB容量SSD价格被高估约200%;而机械硬盘(HDD)价格则保持稳定,大容量4TB PCIe 5.0 SSD价格在疫情期间上涨32%至72%后也趋于稳定 [7] 市场阶段与展望 - 根据硬件价格指数,2026年3月标志着始于2025年秋季的内存危机进入第二阶段,德国零售市场开始表现出一定的抵抗力,部分关键产品类别价格出现首次月度下降 [6] - 尽管3月出现价格下降,但DDR5产品的平均价格仍比危机前水平高出308%,市场希望未来几周价格能够继续下降 [5][6]
半导体制造,变了
半导体行业观察· 2026-03-17 10:27
文章核心观点 - 半导体制造业的竞争逻辑正在从硬件(工艺、设备、产能)转向软件,设备长期竞争力的核心越来越取决于其软件架构与底层平台能力 [1] - 行业正进入新阶段,设备复杂性剧增,对实时控制、边缘智能、系统整合和长期运维的要求,使得能够支撑确定性控制、混合关键负载、开发运维一体化的平台型能力价值凸显 [1][6][10] - 风河公司作为案例,其从实时操作系统厂商向覆盖控制、整合、开发与运维的平台型能力提供商的演进,契合了半导体设备软件化、智能化的结构性产业趋势 [7][10][11] 半导体制造业的竞争逻辑转变 - 传统竞争焦点是工艺制程先进性、设备精度和产线效率 [1] - 新趋势是AI推高了对逻辑、存储及先进封装的需求,导致半导体专用设备本身变得更复杂,需要更高密度数据采集、更精细运动控制、更频繁软件迭代、更强联网与边缘分析能力以及更严苛的安全可靠性 [1] - 设备性能依然重要,但决定长期竞争力的关键已从硬件本身转向承载其上的软件架构与底层平台能力,例如光刻机的灵魂已是其数万个传感器之上的实时控制软件与数据处理系统 [1] 半导体制造依赖底层平台的原因 - 系统结构上,半导体制造已是高度依赖控制软件、数据系统和边缘智能的复杂集合体,而非单一机械系统 [2] - 先进制程(如3nm)与先进封装将控制精度、响应时延和系统协同推向极致,例如极紫外光刻机需皮米级对准精度,刻蚀机需毫秒级协同调整 [2] - 智能制造趋势倒逼设备商与制造商重新思考软件开发与运维方式,以缩短周期、提高效率、安全升级并整合边缘数据 [2] - 行业不容试错,任何软件问题都可能导致良率波动、产能损失或交付风险,因此传统的单层软件架构已难以满足叠加了实时控制、边缘计算、可视化、联网、安全等多重能力的新设备需求 [3] 半导体制造对底层平台的关键要求 - **实时性与确定性成为底线能力**:多个关键设备环节依赖实时操作系统实现极低时延和确定性控制,例如光刻机需纳秒级同步、刻蚀机需微秒级终点监控、薄膜沉积设备需原子级厚度控制、检测设备需实时处理高速图像流 [4][5] - **设备软件走向多域融合**:先进设备需同时承载控制、应用、边缘分析、人机交互、联网、AI推理等混合关键负载,传统单层架构难以兼顾,混合关键系统通过虚拟化技术在同一硬件上同时运行实时操作系统和通用操作系统成为解决方案 [5] - **重构开发到交付的链路**:设备软件规模变大、变体增多、合规趋严,需要更统一的开发流程、标准化测试和完整生命周期管理能力,取代传统的“工具拼装式”开发模式 [5] - **IT/OT融合与边缘到云协同成为必答题**:产线价值取决于设备能否与工厂数据、分析、维护系统真正打通,因此底层平台需具备系统整合、软件开发、后续升级与长期维护等完整能力 [6] 风河公司的定位与解决方案 - 风河正从传统的实时操作系统厂商演进为提供平台型能力的厂商 [7] - 其解决方案组合包括:风河开物RTOS(保障运动控制实时性)、风河Linux(承载边缘分析负载)、风河开物Hypervisor(实现强隔离,确保即使上层应用崩溃,底层控制依然稳定) [7] - 公司强化了围绕复杂软件开发与交付的平台工程思路,提供更统一的开发流程、通用基线和系统的安全与漏洞管理方式 [7] - 这与半导体设备企业面临的问题一致:设备型号增多、需求分化、芯片平台异构化、软件功能叠加,需要从项目交付思维转向平台工程思维,以管理复杂度并在产品复用、一致性控制、测试验证和安全治理方面建立优势 [8] 风河的合作与产业趋势 - 风河已与AI半导体企业DEEPX合作,将AI半导体与其RTOS、Hypervisor结合,面向工业、机器人等关键任务场景开发软硬件解决方案 [8] - 合作旨在以更低成本为实时或边缘系统增加加速AI功能,并通过预验证方案栈降低复杂性、缩短开发周期 [8] - 这释放出明确信号:边缘AI、实时控制与关键任务系统的融合正在加深芯片、底层操作系统、虚拟化能力和行业应用之间的耦合 [8] - 未来的半导体专用设备将越来越依赖一套能够同时承载确定性控制、边缘智能和长期运维的软件底座,这正是风河持续押注的方向 [9] 软件定义设备趋势下的机会 - 半导体制造正向更智能、自动化、可持续的系统演进,设备软件正从附属品转变为制造能力本身的一部分 [10] - 风河的机会不仅在于销售单一产品,更在于能够同时支撑控制、整合、开发与运维的平台型能力,正随着行业对设备软件能力要求的提高而迎来更高价值 [10] - 公司切中的是半导体专用设备对软件能力要求持续提升后的结构性机会 [10] - 当半导体制造越来越像一套持续演进的复杂软件系统时,能够覆盖确定性控制、系统隔离、边缘智能与开发运维链路的平台型能力正从幕后走向前台,这提升了风河的产业相关性 [11]
HBM 4,正式量产
半导体行业观察· 2026-03-17 10:27
美光科技产品发布与量产进展 - 公司宣布专为英伟达Vera Rubin GPU平台设计的36GB 12-Hi HBM4显存已实现量产 [2] - 公司同时宣布业界首款PCIe 6.0数据中心SSD和全新SOCAMM2模块量产,成为首家同时为Vera Rubin生态系统提供这三款量产产品的内存供应商 [2] - 该HBM4显存引脚速度超过11 Gb/s,带宽超过2.8 TB/s,与公司自身同配置的HBM3E相比,带宽提高2.3倍,能效提升20%以上 [2] - 公司已向客户交付48GB 16H HBM4芯片堆叠样品,与36GB 12H产品相比,单颗HBM容量提升33% [2] - 公司此前宣布的9650 SSD(PCIe 6.0)已进入量产,支持高达28 GB/s的顺序读取速度和550万随机读取IOPS,读取性能比PCIe 5.0提升一倍,每瓦性能提升100% [3] - 公司192GB SOCAMM2内存模块专为英伟达Vera Rubin NVL72系统和独立Vera CPU平台设计,其SOCAMM2产品组合容量涵盖48GB至256GB [3] 三星电子与SK海力士技术展示 - 三星电子在GTC 2026首次公开其新一代HBM芯片HBM4E,为第七代HBM,计划支持每引脚16Gbps的传输速度和4.0TB/s的带宽 [4][5] - 三星展示了用于英伟达Vera Rubin平台的内存和存储设备,集成了包括SOCAM2内存模块和PM1763存储设备在内的多种产品,强调其提供“整体解决方案”的能力 [5] - SK海力士在GTC 2026以“聚焦AI内存”为主题展出产品,包括已搭载于英伟达GPU的HBM4和HBM3E内存、采用其LPDDR5X内存的英伟达AI超级计算机“DGX Spark”,以及与英伟达合作开发的液冷eSSD固态硬盘 [5] - SK海力士高管出席GTC 2026,计划与全球大型科技公司会面,探讨人工智能技术合作 [6] 行业技术发展与竞争格局 - 下一代人工智能平台(如英伟达Vera Rubin)的发展由整个生态系统通过联合工程创新推动,计算与内存的协同扩展至关重要 [2] - 内存和存储产品被视为释放下一代人工智能全部潜能的核心基础 [2] - 高带宽内存(HBM)、服务器内存和存储是人工智能基础设施的关键组件,主要内存供应商均在此领域展开竞争 [4] - 行业技术迭代加速,公司正基于HBM4量产积累的技术优势,加速开发下一代HBM4E产品 [4][5]
跌落神坛的日本功率半导体
半导体行业观察· 2026-03-17 10:27
文章核心观点 日本功率半导体产业正面临内忧外患的结构性危机,内部高度碎片化且合作困难,外部则受到中国企业在硅基器件、碳化硅和氮化镓等领域的全面冲击,市场份额和技术优势正被快速侵蚀。在此压力下,行业开启整合时代,电装拟以1.3万亿日元收购罗姆是标志性事件,旨在构建垂直整合巨头以应对竞争。同时,日本在氧化镓、金刚石等第四代半导体领域保有先发技术优势,试图开辟新赛道,但中国企业的追赶速度同样迅猛。产业整合是应对挑战的必要举措,但远非充分条件,日本企业的时间窗口正在收窄[2][5][28][34][37]。 日本功率半导体产业的辉煌与现状 - 日本功率半导体曾高度辉煌,在2021年全球前十名中占据五席,合计市场份额超过20%[5] - 核心企业包括三菱电机(全球第4)、富士电机(第5)、东芝(第6)、瑞萨电子(第9)、罗姆(第10),在IGBT、MOSFET等领域建立了深厚工艺壁垒[5] - 日本政府设定雄心目标,计划在2030年前将全球市占率从约20%提升到40%,并为此提供巨额补贴,例如向富士电机与电装联盟提供705亿日元,向罗姆与东芝合作拨款1294亿日元[5] - 功率半导体是控制与转换电能的核心部件,广泛应用于工业、高铁、新能源汽车等领域,对能源进口依存度高达90%的日本具有重要战略意义[3][5] 中国企业的全面冲击 - **终端市场冲击**:日本电动车渗透率不足10%,远低于中国已突破60%的水平,导致与日系车企深度捆绑的日本功率半导体企业(如罗姆、三菱电机)的碳化硅产能扩张回报周期被无限拉长[7][8] - **硅基器件(IGBT/MOSFET)冲击**: - 中国IGBT企业(如中车时代电气、斯达半导、比亚迪半导体)凭借新能源汽车与光伏逆变器市场快速崛起,并形成“器件+模块+整机”的一体化产业模式[10] - 中国厂商在全球MOSFET市场合计市占率已超过10%,取代了日本厂商在中低端市场的地位[11] - 日本企业在硅基战线已从阵地战退守至依赖高端模块和工控特种领域的据点战[11] - **碳化硅(SiC)冲击**: - **衬底端**:中国凭借低廉电价(能源成本占生产总成本30%-40%)实现成本领先。天科合达与天岳先进合计占据全球SiC衬底市场超过三分之一份额,天科合达市占率约17.3%,天岳先进约17.1%[12] - 天岳先进上海临港工厂导电型衬底年产能达30万片,并已实现8英寸衬底量产,单片晶圆可产芯片数提升40%以上[12] - 成本差距悬殊:中国6英寸SiC衬底生产成本约1.8万日元(120美元),日本同类产品约4万日元(270美元),中国产品成本低约60%[13] - **器件端**:技术差距快速缩小,从普遍认为的3-5年修正至3年以内,部分品类在2-3年。2024年中国SiC器件市场规模约200亿元人民币,年增50%,中国本土厂商全球份额从2022年7.1%提升至2024年约13.4%[13] - **氮化镓(GaN)冲击**: - 中国英诺赛科凭借全球首家规模化量产8英寸GaN-on-Si晶圆实现崛起,到2024年底月产能达1.3万片8英寸晶圆,计划五年内提升至7万片[25] - 英诺赛科是全球唯一覆盖15V至1200V全电压谱系的GaN功率半导体供应商[25] - 日本企业因早期战略聚焦SiC和守护硅基存量市场,在GaN领域已落后。英诺赛科等中国企业的先发优势已在产品覆盖、客户绑定和规模上形成生态壁垒[26][27][28] - **总体技术差距评估**:日本在硅基芯片技术领先中国约1至2年,碳化硅领域领先约3年,氮化镓已经落后2-3年[28] 日本产业内部的结构性矛盾 - **高度碎片化困局**:五大巨头(三菱电机、富士电机、东芝、罗姆、电装)全球市占率均未超过5%,彼此视作竞争对手,合作意愿低[16] - **合作失败案例**:罗姆与东芝曾于2023年以3000亿日元参与东芝私有化,并启动联合生产,但深度合作谈判陷入停滞,罗姆私下放弃了联合生产以外的合作努力[16] - **整合障碍**:企业间缺乏信任,对专有技术保护本能强烈;缺乏领头羊,各家企业市占率相近、优势各异,无人愿意在整合中率先妥协[17] - **市场下行侵蚀整合能力**: - 罗姆2025财年净亏损500亿日元(12年来首次),其中设备减值损失达300亿日元,产能利用率跌至30%以下,碳化硅扩产计划从2800亿日元腰斩至1500亿日元[14][19] - 瑞萨电子因预付款供应商Wolfspeed破产重组,2025年上半年净亏损1753亿日元[19] - 三菱电机无限期推迟熊本县SiC晶圆厂扩建计划,3000亿日元五年投资计划面临大幅缩水[19] 产业整合动态与电装的收购 - **标志性事件**:2026年3月,电装正式向罗姆提出全面收购要约,总金额最高达1.3万亿日元(约83亿美元),创日本半导体行业近年并购规模之最[2] - **电装收购动机**:旨在向“半导体+系统方案商”转型,为丰田集团电动化战略构建从设计、制造到集成的完整半导体供应链,并掌握罗姆在碳化硅领域(全球SiC市占率约14%)的垂直整合能力[21][22] - **市场质疑与风险**:收购消息导致电装股价下跌近5.6%。投资者质疑电装能否扭转罗姆的亏损颓势,并担忧罗姆被收购后可能面临客户流失风险(其客户多为其他汽车一级供应商)。收购还将引发与富士电机现有合作关系的处置难题[23] - **另一重组路径**:三菱电机与东芝就功率半导体业务重组展开磋商,代表产业整合的另一条可能路径[2][37] 第四代半导体的新赛道竞争 - **日本的技术先发优势**: - **氧化镓(Ga₂O₃)**:击穿场强是碳化硅的3倍以上,器件导通特性约为SiC的10倍。日本Novel Crystal Technology已实现2英寸、4英寸衬底批量供应,计划2025年达到每年2万片4英寸晶圆产能。Flosfia已制备出全球导通电阻最小的氧化镓肖特基二极管[30] - **金刚石半导体**:导热率是硅的13倍,理论上可承受硅基器件约5万倍的电功率处理能力。日本早稻田大学团队开发出能处理超过6.8安培电流的金刚石功率器件。Ookuma Diamond Device预计2026财年投产量产工厂。日本国立材料科学研究所(NIMS)成功开发全球首个n通道金刚石MOSFET[31] - **战略布局**:丰田与电装的合资公司MIRISE Technologies已启动与Orbray合作开发电动车用垂直金刚石功率器件的三年期项目[33] - **中国的快速追赶**: - 2025年3月,杭州镓仁半导体发布全球首颗8英寸氧化镓单晶[33] - 西安交大团队实现2英寸异质外延单晶金刚石自支撑衬底的批量化制备[33] - 中国科学院宁波材料所在4英寸自支撑金刚石薄膜的超低翘曲度制备上取得突破[33] - 天岳先进、力量钻石等中国企业已布局金刚石等第四代半导体材料研发[33] 历史对比与产业出路 - **与历史逻辑芯片失落的相似性**:当前功率半导体困境与30年前日本逻辑芯片产业因固守垂直整合模式而错失专业化分工浪潮的历史相似,核心难题都是如何在技术优势被稀释前完成产业整合[34] - **功率半导体的独特壁垒**:不同于逻辑芯片,日本在高端IGBT模块、车规级可靠性认证、材料工艺积累等方面仍有真实技术护城河,在轨道交通、工业变频等高压模块领域的积累难以被快速替代[35] - **整合的意义与局限**:电装若成功收购罗姆,将诞生日本功率半导体史上第一个Tier 1+IDM垂直整合巨头,获得与中国企业对垒的技术底气。然而,并购是压力下的主动求变,产业整合必要但远不充分,日本的时间窗口正在收窄[36][37]
推理芯片时代,正式开启
半导体行业观察· 2026-03-17 10:27
英伟达发布新一代推理芯片Groq 3 LPU - 在GTC大会上,英伟达首席执行官黄仁勋宣布推出专为人工智能推理设计的新一代芯片Nvidia Groq 3语言处理单元(LPU),该芯片融合了公司以200亿美元从初创公司Groq获得授权的知识产权[2] - 黄仁勋强调人工智能推理的转折点已经到来,指出AI需要进行推理以完成思考和行动,推理任务对低延迟有极高要求[2] - 英伟达Groq 3 LPU的发布距其与Groq达成合作协议仅两个半月,凸显了推理市场发展的紧迫性[3] 推理芯片的技术架构与优势 - Groq的加速推理方法采用芯片上处理单元和SRAM内存交错排列的设计,取代了GPU常用的高带宽内存(HBM),实现了简化的线性数据流,以满足低延迟需求[5] - 与Rubin GPU相比,Groq 3 LPU仅配备500 MB的SRAM内存,运算速度为每秒1.2千万亿次浮点运算(petaFLOPS),但其内存带宽高达每秒150 TB,是Rubin GPU(每秒22 TB)的七倍,这种设计使其在推理任务上表现卓越[6] - 推理分解技术成为趋势,亚马逊网络服务(AWS)部署的系统将推理分为预填充和解码两部分,Cerebras CS-3芯片通过集成44 GB的SRAM和21 PB/s的网络连接来解决内存带宽问题[7] - 英伟达计划在其Nvidia Groq 3 LPX组合计算托盘中利用推理分解技术,每个托盘容纳8个Groq 3 LPU和一个Vera Rubin(结合了Rubin GPU与Vera CPU),以充分发挥各自优势,目前该产品已开始量产[8] 推理芯片市场的竞争格局与驱动力 - 分析指出,训练AI模型是成本支出,而推理是能直接产生收入的“利润中心”,低延迟能创造更多收入[9] - GPU(主要由英伟达主导)在大型训练和推理中占主导,但推理需求的激增正在创造GPU以外的机会,尤其是在企业从试点转向生产阶段之际[9] - 对于许多规模较小的公司(如员工约1万而非10万),在部署AI时面临电力、散热和GPU供应限制,使得GPU密集型集群不切实际,这为专用推理芯片创造了机会[10][11] - 根据Futurum Group 2025年11月的调查,到2025年,GPU占数据中心计算支出的58%;到2026年,XPU(如ASIC和定制加速器)预计增长22%,超过GPU(19%)和CPU(14%)[11] - 随着推理工作负载总量超过训练,对架构多样性的需求更大,因为替代XPU架构可以在特定推理任务上实现更高效率[12] 主要厂商的推理战略布局 - 英伟达已意识到对专用推理处理器的需求,2024年其数据中心约40%的收入来自推理业务;2025年9月发布了专为大规模上下文推理设计的Rubin CPX GPU[12] - 除了计划收购SambaNova,英特尔在其至强CPU中集成AMX加速器,并提供专用于推理的Gaudi AI加速器[13] - AMD在2025年11月收购了推理初创公司MK1,以优化其GPU在大规模企业部署中的高速推理[13] - 谷歌最新的TPU芯片和高通即将推出的AI200/AI250芯片也被视为推理领域的有力竞争者[13] - 数据中心推理领域的其他竞争者包括Cerebras(其系统约70%的工作负载集中在推理)和基于RISC-V的Tenstorrent[14][15] - 韩国公司如FuriosaAI和Rebellions也在NPU(网络处理单元)领域从边缘到数据中心进行多元化发展[15] 初创公司机遇与市场挑战 - 初创公司正在解决影响推理性能的内存和网络瓶颈,例如SiFive推出协处理器以降低内存延迟,NeuReality推出支持超以太网规范的网络接口卡,d-Matrix的内存解决方案据称运行速度比HBM快四倍且成本更低[16] - 分析师预计英伟达将保持主导,但多样化的需求为专业解决方案提供了抢占市场份额的空间,市场仍处于早期阶段,有足够空间容纳众多供应商[14][18] - 尽管GPU因其可编程性和多功能性仍占主导,但专用推理芯片在成本、功耗和性能上的优势创造了巨大机遇,主流企业预计在2026年更广泛采用技术,可能释放对以推理为中心的初创公司的需求[18] - 市场可能出现更多整合,一些早期初创企业面临挑战,例如SambaNova以16亿美元出售被视为“甩卖”[18]
三星晶圆厂,拿下两个大客户
半导体行业观察· 2026-03-17 10:27
英伟达与三星电子的合作 - 英伟达首席执行官黄仁勋在GTC2026上确认,三星电子是其专用于推理的语言处理器芯片“Groq3 LPU”的关键制造合作伙伴,目前正以最快速度提高产量 [2] - Groq3 LPU芯片将安装在英伟达下一代人工智能芯片系统“Vera Rubin”中,预计出货量可能在今年下半年开始,大概在第三季度左右 [2] - 该芯片将与英伟达的“Rubin”图形处理器共同工作以提升推理性能和效率 [2] - 三星电子在GTC展会上首次公开展示了下一代高带宽内存“HBM4E”的物理芯片和用于堆叠的“核心芯片”晶圆,积极宣传其在存储器领域的合作 [2] 三星电子HBM4E技术进展 - HBM4E预计将于今年下半年开始出货样品,其单引脚传输速率预计可达16 Gbps,带宽为4.0 TB/s,性能超过已开始量产的第六代HBM4 [3] - 三星计划利用其HBM4量产积累的1c DRAM工艺技术和4纳米基片设计能力,加速HBM4E开发 [3] - 三星在GTC大会上重点展示HBM4E,旨在凸显其与SK海力士、美光等竞争对手的差距,是唯一将HBM4E置于首要位置的存储器公司 [3] - 三星展示了“HBM4 旗舰墙”以强调集成器件制造商优势,并发布混合铜键合封装技术,该技术耐热性比热压键合提高20%,支持16层或更高层堆叠 [3] AMD与三星电子的潜在合作 - AMD首席执行官苏姿丰计划访问韩国,会见三星电子高层,这是其自2014年上任以来首次访韩,突显三星存储器战略重要性提升 [5][6] - 访问将探讨包括通用DRAM、NAND闪存以及第六代高带宽内存在内的内存产品长期供应协议,反映出行业面临通用内存供应严重短缺问题 [6] - 双方还将讨论代工合作,AMD可能将部分芯片订单分配给三星最先进的代工工艺,若达成将是史无前例的合作,有望增强三星晶圆代工盈利增长势头并获得其他大型科技客户认可 [7] - 此次合作若公开,将再次凸显三星半导体的战略重要性 [7] 特斯拉内部半导体项目“Terafab” - 特斯拉首席执行官埃隆·马斯克宣布,内部半导体生产项目“Terafab”将于3月21日启动,采用垂直整合架构,集逻辑处理、存储器存储和先进封装于一体 [8] - 该项目是特斯拉为应对未来三到四年内可能出现的半导体供应短缺而建立,预计成本约为250亿美元,是特斯拉2026年最大规模资本支出计划的一部分 [8] - 生产目标明确,计划每年生产1000亿至2000亿颗定制化AI和存储半导体,并将月晶圆产量从10万片提升至100万片,规模相当于台积电目前美国单一工厂总产能约70%,工艺技术瞄准2纳米制程 [9] - 该工厂将为特斯拉的全自动驾驶软件、Cybercab无人出租车和Optimus人形机器人提供AI半导体,并为马斯克另一家公司xAI的Grok模型训练基础设施及Dojo超级计算机提供芯片,旨在实现供应链完全独立 [9][10] - 若项目成功,特斯拉将成为极少数能自主大规模生产尖端AI半导体的公司之一,可能从根本上改变其自动驾驶汽车和机器人业务的成本结构 [10]
夺天下,群英会!
半导体行业观察· 2026-03-17 10:27
Mini SSD产业生态构建 - 公司联合英特尔、龙旗、比亚迪电子、立讯等产业链上下游头部厂商,于3月6日召开“夺天下·群英会”战略研讨会,共同构建了Mini SSD产业生态 [2] - 首批发起单位作为生态核心构建者,将率先享有专利授权带来的直接效益以及资源协同带来的边际效益,标志着Mini SSD从“单一产品创新”迈向“WIN-WIN共赢”新阶段 [4] - 研讨会围绕“标准统一、利益共享、场景落地”等核心议题,共同绘就了Mini SSD的未来生态蓝图 [19] Mini SSD产品性能与优势 - Mini SSD具备极致小型化尺寸(半枚硬币大小),采用PCIe Gen4旗舰级性能、LGA封装带来高抗震性,以及SIM卡式扩展设计 [26] - 相较于传统M.2 2230 SSD,其体积减少40%,重量仅1g,为轻薄本内部设计腾出空间 [30] - 产品随机读取性能高达850K IOPS,提供主机级加载速度 [30] 市场应用与商业化进展 - Mini SSD已进入商业化落地阶段,获得了行业头部客户的青睐 [18] - 壹号本、GPD、Waterworld三家领先智能终端品牌已率先在其掌上游戏机、AI PC、智能相框等旗舰产品中搭载Mini SSD [18] - 产品导入优化了用户体验,带来了可观的市场增长与良好的品牌口碑 [18] - 产品为笔记本、超薄本、相机、机器人、无人机、Mini PC等终端应用提供高效、创新的可扩展存储解决方案 [26] 具体应用场景价值 - **笔记本与超薄本**:可插拔扩容设计能应对AI PC本地大模型的海量数据需求 [30] - **智能机器人**:高速读写与抗震动性确保数据实时稳定读取,模块化设计支持全生命周期内灵活扩展存储,积累训练数据以实现“终身学习” [30] - **无人机**:抗震与宽温适应能力确保在极端环境下稳定记录4K/8K高清素材,2TB容量提供更多数据空间 [30] - **游戏掌机**:在极度受限的内部空间内,满足大型3D游戏秒级加载的需求 [30] 产业生态发展共识与规划 - **标准与生态建设**:各方一致认为需搭建“利益共享机制”,尽快成立IP公司及组织规则,通过制定清晰的激励方案、权益金分配等规则,将生态伙伴利益深度绑定 [24] - **技术适配与方案导入**:龙旗、亿道、美高、极摩客等头部企业表示,将围绕旗下超薄笔记本、Mini PC等旗舰产品启动Design-in工作,进行联合技术攻关 [24] - **市场推广与应用策略**:会议明确了“价值驱动”核心方针,针对PC场景探索将热门游戏、AI大模型等内容预装至Mini SSD的分发模式,创造新利润空间,并联合推动产品在游戏掌机、AI PC及机器人等领域的规模化普及 [24] 产品所获国际荣誉与行业认可 - Mini SSD荣获《时代》周刊(TIME)“年度最佳发明”奖项,该榜单从全球数千项发明中甄选,被誉为全球创新成就的“风向标” [10] - 产品成功入围爱迪生发明奖(Edison Awards)决赛名单,该奖项被誉为“科技界的奥斯卡”,由3000余名全球顶尖专家评审,意味着其在技术创新、市场潜力及社会影响力上达到世界顶级水准 [15] - 在CES 2026上,Mini SSD从全球4000多家参展商、数万件展品中脱颖而出,荣获由权威媒体《TWICE》颁发的“TWICE Picks Awards”大奖,该奖被视为消费电子领域的“品质与创新通行证” [16] - 产品获得Embedded World“Best-in-Show”奖项,该奖项是嵌入式系统领域最具权威性的奖项之一,由一线工程师与行业专家评定 [17] - 产品获得MWC 2026“Best-in-Show”奖项,该奖项由TechRadar、Tom's Guide等全球头部科技媒体联盟联合评选 [18]
英伟达正式发布LPU,CPU重磅更新:GPU不再是GTC唯一主角
半导体行业观察· 2026-03-17 06:10
公司战略与市场前景 - 公司首席执行官预测人工智能热潮将在未来一年内产生价值1万亿美元的订单积压,是去年同期预测的两倍[1][5] - 公司首席执行官宣称正处于一个全新平台变革的开端,并重新定义了计算[5] - 首席执行官认为人工智能的发展仍处于起步阶段[4] - 首席执行官强调推理转折点已经到来,2026年将是推理能力主导人工智能的一年[50] - 公司被描述为“垂直整合但横向开放”,旨在向客户提供完整的技术栈[59] - 公司预告下一代Feynman系统,配备全新GPU、LPU、CPU等,预计2028年发布[60] 新产品发布:Rubin平台与Groq 3 LPU - 公司在GTC 2026上发布了多颗芯片和系统,以迎接市场机会[6] - Rubin平台新增Nvidia Groq 3 LPU,这是一款推理加速器,旨在增强系统以低延迟、大批量方式交付令牌的能力[7] - Groq 3 LPU集成了500 MB的SRAM,可提供150 TB/s的带宽,远高于HBM的22 TB/s[9] - 公司将构建包含256个Groq 3 LPU的Groq 3 LPX机架,提供128GB的SRAM和40 PB/s的推理加速带宽[11] - Groq LPX被设想为Rubin的协处理器,旨在提升解码性能,并服务于需要高交互性的多智能体系统[12] - 在多智能体系统中,Rubin GPU和Groq LPU的组合可将人工智能代理间通信的吞吐量从每秒100个token提升到每秒1500个token甚至更高[13] - Groq 3 LPU的推出旨在帮助公司在低延迟推理领域抵御Cerebras等挑战者,并可能导致Rubin CPX推理加速器的作用降低[15] 新产品发布:Vera CPU及机架系统 - 公司公布了全新88核Vera数据中心CPU的细节,声称其性能比标准CPU提升50%[16] - Vera CPU得益于Olympus核心IPC提升1.5倍,以及创新高带宽设计,提供最快的单线程性能[16] - 公司发布了Vera CPU机架架构,将256个液冷CPU集成到一个机架中,专为以CPU为中心的工作负载设计[16] - 该机架据称CPU吞吐量提升6倍,在智能AI工作负载中性能提升2倍[16] - Vera CPU的演进标志着公司正式进军CPU直销领域,成为英特尔和AMD的有力竞争对手[16] - 公司声称Vera CPU沙箱性能比x86竞争对手高出1.5倍,每个核心的内存带宽高出3倍,能效高出两倍[19] - Vera是一款88核144线程的CPU,采用公司设计的Arm v9.2-A Olympus核心,支持空间多线程技术[19][20] - 所有88个核心排列在一个域中,避免了NUMA架构的延迟问题[21] - Vera架构内存带宽达到1.2 TB/s,平均每个核心13.6 GB/s,单个核心最高支持80 GB/s吞吐量[22] - 芯片配备NVLink-C2C芯片间接口,吞吐量高达1.8 TB/s,是上一代Grace芯片的两倍[23] - Vera CPU机架包含256个液冷CPU、74个Bluefield-4 DPU和ConnectX SuperNIC网络,配备高达400 TB的LPDDR5内存,总内存吞吐量达300 TB/s[28] - 公司分享了基准测试结果,声称在各种工作负载下,其性能比Grace提高了1.8倍到2.2倍[29] - 公司将向Meta、Oracle、Coreweave、Nebius、阿里巴巴等超大规模数据中心运营商提供Vera CPU机架系统[30] - 众多OEM和ODM厂商将提供单路和双路服务器,Vera CPU也将用于Nvidia HGX NVL8系统[31] - Vera CPU目前已全面投产,预计将于今年下半年开始交付[32] 新产品发布:太空计算与边缘产品 - 公司发布了Vera Rubin太空模块,声称其在轨道推理工作负载方面的AI计算能力是H100的25倍[33] - 该模块专为在太空直接运行LLM和高级基础模型的轨道数据中心设计[34] - 已有六家商业航天公司部署了该平台[33] - 公司还面向任务关键型边缘环境推出Nvidia IGX Thor,面向卫星推出Jetson Orin[36] - 公司推出RTX PRO 6000 Blackwell系列服务器版GPU,声称在分析大型图像存档时,其性能比传统的基于CPU的批处理系统提升高达100倍[37] - 目前有六家公司正在轨道和地面环境中使用其平台[37] 公司业绩与市场挑战 - 公司凭借在人工智能芯片市场的主导地位,年收入从2022年的270亿美元增长到去年的2160亿美元,市值达到4.5万亿美元[42] - 自去年10月市值短暂突破5万亿美元大关以来,公司股价已经降温,原因是人们担心人工智能的热潮被过分夸大[43] - 尽管2月下旬发布的季度报告远超预期且管理层展望乐观,公司股价仍比数据公布前下跌了6%[45] - 分析师预计公司明年的收入将超过3300亿美元[46] - 公司在人工智能芯片市场正面临严峻挑战,因为谷歌和Meta等其他科技巨头试图开发自己的处理器[46] - 公司的潜在增长受到美国安全和贸易壁垒的制约,这些壁垒阻碍了其在中国销售先进芯片的能力[47] - 公司目前面临的挑战是其畅销产品在推理计算方面的吸引力不如在训练计算方面,用户反映其Grace Blackwell服务器能耗大且内存不足[51] - 有观点认为,由于推理计算商业模式重视效率和降低成本,且该领域竞争加剧,公司高达73%的毛利率必然会下降[52][53] - 为了帮助过渡到推理领域,公司与Groq达成了一项数十亿美元的授权协议,并聘用了该初创公司的顶尖工程师[54] - 有分析师认为公司市值将在未来一年左右超过6万亿美元[55] 行业竞争与格局变化 - 公司进军CPU市场,将对AMD和英特尔在人工智能数据中心的插槽争夺战构成严峻挑战[18] - 公司还需要与全球最大的超大规模数据中心运营商使用的各种定制Arm处理器展开竞争[16] - 包括OpenAI在内的众多大型客户已签约使用Cerebras的计算能力,以利用其平台优异的延迟特性[15] - 越来越多的迹象表明,公司正在将其重心从GPU转向推理计算解决方案提供商[56] - Meta宣布将在其人工智能数据中心部署数千颗英伟达Vera CPU,这是公司人工智能系统首次大规模部署且未使用GPU[56] - 据《华尔街日报》报道,公司计划推出新的采用多个独立于GPU的CPU的计算解决方案[57] - 英特尔宣布其Xeon 6处理器将作为Nvidia DGX Rubin NVL8系统的主机CPU,扩展了双方的合作[58] - 在推理迅速崛起的当下,公司能否继续垄断市场存在不确定性[62]
台积电1.2nm,新进展
半导体行业观察· 2026-03-16 09:11
台积电1.2纳米制程工厂规划与环评进展 - 台积电1.2纳米制程预定地为沙仑生态科学园区,原定2025年底送交环评,因涉及保育类猛禽草鸮栖地,预计今年4月提交环境影响说明书[2] - 沙仑科学园区行政院已核定开发计划,全期土地面积为531公顷,预计完成后产值达2兆2547亿元新台币,提供3.5万个就业机会[2] - 园区开发因涉及草鸮栖地引发环保团体关注,管理机构已优化方案,注重生态空间完整性以降低影响,并将持续沟通寻求产业发展与生态保护的共识[2] 台积电先进制程量产计划与工厂建设 - 台积电2纳米制程量产按计划推进,因市场需求旺盛计划再新建三座工厂[5] - 台积电1.4纳米制程工厂建设进度顺利,其地基工程已于去年11月初动工,工厂位于台湾中科,规划四座厂房及办公大楼[5] - 1.4纳米制程风险性试产预计2027年启动,工厂全面建成投产后量产目标定于2028年[5] 台积电1.4纳米制程的财务与市场前景 - 1.4纳米制程工厂初期建设投资额预计达1.5兆新台币,四座工厂首年合计预计为台积电带来160亿美元营收[6] - 该工厂预计将创造8000至1万个就业机会[6] - 苹果公司被认为有很高机会抢占1.4纳米新技术先机,1.4纳米制程初期良率预计不超过20%,后续有望逐步攀升[6]
俄罗斯自研光刻机,正式推出
半导体行业观察· 2026-03-16 09:11
俄罗斯国产光刻设备进展 - 俄罗斯自主研发的型号为RAVC.442174.002TU的光刻系统,于3月初被正式纳入国家工业信息系统产品目录,标志着其作为可供行业部署的工业产品获得认可 [2] - 该设备由泽列诺格勒纳米技术中心研发,专为生产超大规模集成电路设计,用于将设计图案转移到半导体晶圆上 [2] - 该光刻设备计划于2024年投入生产,是俄罗斯为减少对进口半导体设备依赖而采取的措施之一 [4] 技术规格与能力 - 设备设计用于加工直径达200毫米的半导体晶圆,这是生产电力电子产品、微控制器等专用电路的行业标准尺寸 [6] - 系统的分辨率为350纳米,能够稳定生成特征尺寸约为三分之一微米的电路图案 [6] - 设备工作波长约为365纳米,属于i线紫外光刻范围,适用于许多成熟的半导体技术节点 [6] - 系统的对准精度约为90纳米,这对于确保芯片制造中不同层的精确对齐、防止缺陷至关重要 [6] - 工作曝光区域尺寸约为22毫米 x 22毫米,能够通过步进重复曝光工艺在晶圆上复制单个芯片图案 [6] 研发背景与合作 - 该光刻系统由ZNTC与白俄罗斯公司Planar合作开发,项目于2021年启动,是俄罗斯工业和贸易部资助的项目之一 [8] - 此次合作体现了白俄罗斯和俄罗斯在微电子制造领域持续的技术合作,旨在开发一种能够在国内使用的光刻工具 [8] 市场应用与意义 - 350纳米工艺节点虽非前沿,但在工业电子、汽车系统、电源管理器件及众多嵌入式应用领域仍广泛应用 [3] - 该技术节点在电力电子、汽车微控制器、传感器、航空航天电子、电信基础设施和工业控制系统中具有很高的相关性,这些领域更看重可靠性、耐久性和稳定的制造工艺 [10] - 国产光刻设备有助于维持和扩大俄罗斯国内此类电子产品的生产,减少对进口设备的依赖 [10][13] 产业生态与战略定位 - 泽列诺格勒纳米技术中心位于俄罗斯的“硅谷”泽列诺格勒,是俄罗斯微电子生态系统的关键组成部分,致力于半导体技术和先进制造设备的研发 [4][19] - 将设备纳入国家工业信息系统目录,使其能被潜在工业客户和政府采购项目了解,是国家进口替代战略的一部分,为国产技术的工业应用提供了途径 [15] - 光刻系统是半导体制造中最复杂、最具战略意义的设备之一,其国产化是俄罗斯提升半导体行业技术自主性全面举措的一部分 [12] 未来发展计划 - 研发工作的下一阶段目标是开发分辨率约为130纳米的光刻设备,这将更接近21世纪初全球广泛采用的技术节点,能极大拓宽国产设备可制造的电路种类 [17] - 迈向更精密光刻技术需要对精密对准技术、晶圆处理系统、隔振技术和光学器件等进行改进,技术挑战依然存在 [17] - 国产光刻设备的出现,即使是在成熟节点,也凸显了半导体技术的战略意义以及全球为争夺这一关键产业控制权而日益激烈的竞争 [21]