Workflow
半导体行业观察
icon
搜索文档
刚刚,Arm正式发布自研芯片
半导体行业观察· 2026-03-25 03:14
文章核心观点 - Arm公司发布了其首款自主研发的芯片产品Arm AGI CPU,标志着公司从IP授权向提供自主设计处理器的战略扩展,旨在为下一代AI基础设施,特别是智能体人工智能(AGI)工作负载提供动力[1] - 该芯片基于Arm Neoverse平台打造,旨在满足AI数据中心对大规模、持续稳定性能、高能效和快速部署的需求,并已获得包括Meta在内的多家行业领先企业的合作与订单[1][2][7] 产品发布背景与战略意义 - 这是Arm超过35年历史上首次推出自主研发的芯片产品,将业务从IP和计算子系统扩展到提供完整的自主设计处理器[1] - 此举反映了AI基础设施的快速发展,以及生态系统对能够快速大规模部署的即用型Arm平台的日益增长需求[1] - 智能体人工智能时代的到来,消除了人类作为计算瓶颈的限制,软件智能体可以协调任务并实时决策,这对底层计算架构提出了新要求[1] - 公司旨在通过此举为客户提供从定制芯片到集成平台级解决方案的更丰富的Arm计算部署选择[1] 产品定位与技术需求 - 在现代AI数据中心,CPU已成为驱动核心,负责协调加速器、管理内存和存储、调度工作负载以及在系统间传输数据[2] - 随着智能体人工智能的出现,CPU还需协调大量智能体之间的任务分发,这对处理器提出了革新要求[2] - Arm AGI CPU旨在并行处理数千个核心,在持续高负载下实现卓越的单任务性能,同时满足现代数据中心的功耗和散热要求[2] - 芯片的每个元素,从运行频率到内存和I/O架构,都经过精心设计以支持大规模并行、高性能的代理工作负载[3] 产品性能与配置 - 参考服务器采用1OU双节点设计,每个刀片含两颗芯片,共272个核心[5] - 30个刀片可完全填充一个标准36kW风冷机架,提供总计8160个核心[5] - 与Supermicro合作的200kW液冷设计可容纳336个Arm AGI CPU,提供超过45000个核心[5] - 在此配置下,每个机架的性能比最新的x86系统高出2倍以上[5] - 性能优势源于:领先的内存带宽使每个机架可执行更多高效线程;高性能的Arm Neoverse V3单核性能优于传统架构;更多的可用线程与更高的单线程处理能力叠加[5] 商业合作与生态系统 - Meta是首席合作伙伴和客户,双方共同开发该芯片以优化其千兆瓦级基础设施,并与Meta自有的定制MTIA加速器协同工作[7] - 其他首发合作伙伴包括Cerebras、Cloudflare、F5、OpenAI、Positron、Rebellions、SAP和SK Telecom,旨在加速云端、网络和企业环境中的AI驱动服务[7] - ASRockRack、Lenovo和Supermicro已开始接受商用系统的订单[7] - 超过50家来自超大规模云、芯片、内存、网络、软件、系统设计等领域的领先企业正在助力Arm计算平台向芯片领域拓展[8] 产品路线图与行业影响 - Arm AGI CPU是公司全新数据中心芯片产品线的首款产品,现已开放订购,后续产品将持续研发[8] - Arm Neoverse CSS产品路线图也在同步推进,以确保所有数据中心客户在平台架构和软件兼容性方面能够协同发展[8] - 公司认为此次发布不仅是在定义AI原生数据中心的架构,更是在构建它[8] - Arm Neoverse已成为众多领先超大规模和AI平台的基础,包括AWS Graviton、Google Axion、Microsoft Azure Cobalt和NVIDIA Vera[2]
全球RISC-V CPU性能新纪录——玄铁C950,正式发布!
半导体行业观察· 2026-03-24 17:13
RISC-V发展历程与现状 - RISC-V过去15年的发展可分为三个阶段:前5年为学术探索期,中间5年为国际标准确立与物联网商用萌芽期,最近5年进入规模化爆发期,在MCU、嵌入式、家电、汽车、通信等众多终端设备中快速铺开 [1] - RISC-V已进入全球主流芯片产业链战略视野,行业预测到2031年,RISC-V设备数量将超过360亿,年复合增长率31.7%,IP销售额将超19亿美元,年复合增长率39.7% [1] - 尽管应用广泛,但RISC-V长期被标签为“低端、嵌入式、家电控制”,在高性能服务器、通用计算平台、云端基础设施及AI系统等核心算力领域缺乏代表性产品 [2] 玄铁C950的性能突破与意义 - 玄铁C950是阿里达摩院发布的最新高性能RISC-V CPU IP,其发布标志着RISC-V开始切入高性能计算与AI领域 [2][4] - C950工作主频可达3.2GHz以上,单核性能超过22/GHz,SPECint2006得分突破70,创下RISC-V最高纪录,性能与Intel Xeon6、Arm V2、AMD Zen5等主流高端CPU处于同一梯队 [5][6] - 在MySQL、Redis、Nginx等典型服务器工作负载下,C950表现可与行业最新产品正面对比,证明了其产业可用性 [7] - C950全面支持RVA23.1标准与扩展,具备COVE等最新规范能力,为进入Linux、Android、服务器、AI、汽车等更大平台环境做准备 [7] - C950的发布为RISC-V建立了首个可授权、可交付、可落地的高性能标杆样板,意味着RISC-V首次以较完整姿态触碰主流高性能计算腹地 [9] 玄铁产品线的演进与战略 - 玄铁产品线通过持续迭代试探并推高RISC-V性能上限:2019年C910首次将运行频率推到2GHz以上,SPECint2006约7/GHz,证明了RISC-V具备高性能潜力 [8] - 2025年发布的C930 SPECint2006达到15/GHz,首次跨入服务器门槛,后续升级至约17/GHz [9] - 玄铁已形成由C925、C930、C950组成的高性能产品梯队,性能层级分别为12/GHz、17/GHz和22/GHz,覆盖从高性能终端、边缘计算到边缘服务器、通用服务器的完整矩阵 [14][16] - C925定位10到12分性能区间,面向更关注能效、面积、成本平衡的端侧和边缘侧客户 [16] - C930定位为面向边缘服务器、DPU、网络等场景的均衡型产品 [16] - C950直指对延迟、吞吐、通用性要求更高的AI Agent、存储、通用服务器等场景 [16] - 玄铁是国内少数能够覆盖从高性能到MCU全系解决方案的IP供应方,“全系列+一致性”能力是其商业竞争力的重要部分 [17] RISC-V在AI时代的机遇与CPU角色重塑 - 在AI Agent时代,计算问题的本质从执行矩阵乘法转向运行高度耦合的复杂系统,系统瓶颈从“算力”转向“系统协同效率”,这使得CPU从“系统底座”上升为“系统中枢” [19][20] - AI系统正从“GPU中心”走向“CPU+GPU协同中心”,高单核能力、良好的I/O能力、安全性及系统协同能力成为AI时代CPU的必备内生能力 [20] - 玄铁C950通过搭载自研Matrix加速引擎,赋予了CPU原生AI能力,在RISC-V CPU上跑通了DeepSeek V3和Qwen3等千亿参数大模型,实测在Qwen3上实现34 Tokens/s,在DeepSeek V3上实现18 Tokens/s [21] - 这证明了RISC-V CPU首次具备了原生支持千亿参数大模型的能力边界,有能力在AI Agent时代承担“大脑中枢”角色 [21] - 从AGI和系统工程角度看,RISC-V当前应优先突破AI推理市场,因其市场更大、商业路径更清晰,而非急于进入更复杂的训练体系 [22][23] Flex可扩展平台的商业模式创新 - 玄铁推出Flex可扩展平台,旨在解决客户差异化需求与通用设计复杂度之间的矛盾 [27] - Flex平台提供处理器建模、微架构设计与扩展环境、软件工具链,允许客户在玄铁通用CPU基础上进行定制化修改,例如为AI客户叠加Vector、Matrix或私有化扩展 [27] - 该模式让客户既能享受RISC-V生态红利,又能保留自身在终端市场的差异化竞争力,形成了“通用底座+客户可持续创新能力”的合作模式 [28] - Flex平台将RISC-V“可定制”的核心魅力商业化、产品化,使芯片设计从“命题作文”变为“命题填空”,赋予客户定义专属CPU的自由度 [28] RISC-V生态构建与中国力量的角色 - RISC-V生态当前的关键矛盾并非生态自然爆发,而是“好芯片仍然不够多”,尤其缺乏开放、标准化、具备竞争力的通用类芯片 [30][31] - C950这类产品的价值在于为RISC-V生态制造更多“可以被反复使用、适配、优化”的公共基础设施,推动生态飞轮转动 [31] - 以“无剑联盟”为代表的举措,正推动生态从“社区繁荣”走向“商业落地”,通过帮助合作伙伴在垂直场景中落地产品(如海尔在家电体系落地RISC-V),形成可复制的商业路径 [32] - 中国厂商正从参与者走向塑造者:阿里巴巴达摩院参与推进下一代开源高性能RISC-V CPU,并参与RISC-V国际基金会服务器标准、Matrix扩展等方向的制定 [34] - 在中国科学院软件研究所发起的OpenRuyi社区中,玄铁贡献了25.27%的Patch,排名第一,成为核心推动者 [34] - 中国企业开始在服务器相关标准、RAS、QOS、可靠性规范等国际舞台掌握话语权,边做产品边推标准,为整个RISC-V生态开荒 [34]
微软投资“光刻机”初创公司
半导体行业观察· 2026-03-24 11:20
公司技术介绍 - 公司开发了一种新型光刻技术,利用氦原子束而非传统的光来进行图案化,这种方法被称为原子光刻 [2][4][5] - 该技术的光束宽度约为0.1纳米,相当于一个氢原子的大小,而当前主流ASML的极紫外光刻工具使用的光束宽度约为13.5纳米 [3] - 该技术理论上能够制造出比目前最先进技术小10倍的芯片组件,实现“最终的原子级分辨率”,并将晶体管尺寸缩小一个数量级 [2][3] - 公司将其技术称为BEUV,其核心优势在于无需掩模即可直接进行图案化,分辨率超越了波长受限的传统极紫外光刻系统 [4][5] 技术优势与潜力 - 该技术有望将芯片制造能力提升15年,支持晶体管的持续小型化,从而延长摩尔定律 [5] - 相比现有技术,该技术能以更具成本效益的方式和显著更低的能耗为芯片制造商提供更先进的制造能力 [5] - 更小的晶体管将使芯片制造商能够大幅提升先进人工智能处理器的性能,远超当前水平 [3] 公司融资与估值 - 公司完成了4000万美元的A轮融资,由Atomico领投,微软风投部门M12、Linse Capital、西班牙技术转型协会和Nysnø等机构参与投资 [2][3] - 公司此前在2023年7月筹集了约45万欧元的种子轮融资,投资方包括Runa Capital、Vsquared Ventures等 [6] - 公司拒绝就整体估值置评 [3] 研发进展与规划 - 公司已开发出原型系统,并计划在2029年左右在试点芯片制造厂中配备测试工具 [3] - 公司的研究成果曾在2024年2月的科学光刻峰会上以研究论文形式发表 [3] - 公司联合创始人共同撰写了一篇题为《利用中性氦原子进行真实尺寸表面映射》的论文,发表在《物理评论A》上,详细介绍了立体氦显微镜 [5] 行业背景与竞争 - 当前尖端芯片制造依赖于光刻工艺,主要设备由荷兰公司ASML主导 [2] - 随着新一轮创业公司涌现,该领域正重新引起投资者和政府的关注,部分公司的目标是与ASML竞争 [2] - 公司技术被视为可能替代极紫外光刻的新方案 [8] 欧盟项目支持 - 公司参与了一个由欧盟资助、名为FabouLACE的项目,该项目预算为250万欧元,旨在开发基于色散力掩模的氦原子光刻技术,目标特征尺寸为2纳米,项目周期为2023年12月至2026年11月 [6] - 此前,公司还参与了一个名为NanoLACE的欧盟研究项目,该项目于2019年启动,预算为365万欧元,最终获得336万欧元资助,已于2024年12月结束 [6] - 欧盟委员会称,公司的目标是在2031年前将该技术推向市场,IMEC研究所将负责监测和验证该技术的性能 [6]
代号“峨眉”!安谋科技自研VPU IP攀上新巅峰
半导体行业观察· 2026-03-24 11:20
文章核心观点 - 安谋科技(Arm China)发布了面向AI应用的新一代VPU IP产品“玲珑”V560/V760(代号“峨眉”),该产品凭借高性能、高灵活性及全场景覆盖能力,旨在为AI时代的各类视频应用提供核心技术支撑,并已获得市场首批客户授权 [1][8][25] “玲珑”V560/V760 VPU IP产品发布与市场进展 - 公司近日在上海举办技术发布会,正式推出新一代VPU IP“玲珑”V560/V760 [1] - 该产品已在服务器、无视频转码等领域完成首批客户授权,客户产品预计今年陆续量产 [1][25] - 产品是公司“All in AI”产品战略下的最新自研成果 [8] “玲珑”V560/V760 VPU IP核心性能与优势 - 产品采用多核多格式编解码融合的可编程处理架构,单核支持4K60FPS编码或8K30FPS解码 [3] - 集成CAE(内容感知编码)先进编码技术,全面支持H.266等主流编解码标准 [3][15] - 相比上一代产品,单核解码性能提升100% [10] - 在丢包率高至20%的情境下仍可纠错解码,具备高鲁棒性 [10] - 同等视频码率下,编码质量平均提升20%;同等编码质量下,视频码率平均降低20%;特定典型场景下码率最大降低80% [11][25] - 通过条带级编解码控制技术显著降低编解码延时 [11][17] - 驱动支持Linux/Android/Windows/RTOS等多操作系统,硬件支持多OS/虚拟化应用 [11] - 支持TrustZone内容保护和高级Mosaic功能,提供信息安全与隐私保护 [11] “玲珑”V560/V760 VPU IP技术架构与研发特色 - 产品核心优势在于采用灵活可配置架构,并融合“积木式堆叠”研发特色 [14] - 创新的多核处理架构支持多核同任务和异任务,满足多样化场景需求 [15] - CAE技术集成轻量化AI,实现“图像语义分析-像素级预处理-码率动态分配”的全链路智能优化 [15] - 硬件支持多OS虚拟化应用场景和视频内容安全访问 [17] - 未来VPU架构将朝AI端到端视频编码技术路径演进,构建“深度感知、全局最优”的AI VPU训练框架 [17] “玲珑”V560/V760 VPU IP应用场景 - 产品能广泛应用于Edge AI、Physical AI及Cloud AI领域,覆盖云、边、端全场景 [6][20] - **Edge AI领域**:适用于手持摄像设备、智能手机、Pad、AI PC、TV、边缘服务器、线上会议等,可显著降低功耗、芯片面积、视频码率和处理延时 [21] - **Physical AI领域**:适用于智能驾驶、智能座舱、机器人等,支持多OS/虚拟化应用,增强系统集成灵活性与安全性,降低开发集成成本与风险 [22] - **Cloud AI领域**:适用于数据中心、视频转码、AI服务器、云游戏等,可实现高性能、高编码质量、高吞吐量、低延时的视频处理 [23] 公司背景与战略 - 安谋科技(Arm China)是国内领先的芯片IP设计与服务提供商 [26] - 公司坚持自研业务技术创新与Arm技术授权相配合,为中国集成电路产业提供产品组合和解决方案 [26] - “玲珑”系列是公司自研的VPU产品线,已有多款面向不同视频应用的IP产品,新产品是第五款 [8] - 公司致力于以持续的技术创新,为AI时代的视频处理打造核心,赋能中国智能计算生态 [25][26]
中安半导体邀您共赴SEMICON China 2026,见证新品重磅发布!
半导体行业观察· 2026-03-24 11:20
行业背景与核心观点 - 2026年全球半导体产业步入先进制程迭代关键期,器件架构向三维高度集成演进,制程窗口收窄,传统检测手段触及瓶颈,量检测技术成为定义制程成败的核心“锚点” [1] - 关键尺寸、形貌及缺陷偏差对良率的影响日益凸显 [1] 中安半导体公司发布会信息 - 公司将于3月26日13:30在上海卓美亚喜马拉雅酒店举办“SEMICON China 2026 线下专场发布会”,邀请专家探讨国产设备在先进制程“深水区”的突围路径 [1] - 发布会主要议题为“定义精度,突破极限” [4] 发布会聚焦的三大核心技术板块 - **先进制程极限检测**:将展示如何在极微观尺度下实现10.5nm的最佳灵敏度,通过高数值孔径与低噪声TDI成像技术的协同设计,精准捕捉导致电路失效的关键缺陷 [5][6] - **先进封装三维量测方案**:针对HBM、3D IC及键合工艺,首度分享针对复杂键合工艺的高精度预测模型,其预测相关性远超行业传统方案 [5][6] - **面向衬底量测解决方案**:在线切、双面研磨、抛光及外延生长等环节,对晶圆平整度和厚度均匀性进行亚纳米级监控,并推出最新设备技术参数前瞻 [5][6] - 发布会旨在展示最新技术进展,以更精准高效的服务协助客户优化生产良率,推动国产半导体设备发展 [7] 中安半导体公司业务与市场地位 - 公司是一家专注于半导体量测与检测领域的高科技公司,为硅片厂、IC Fabs和设备厂商提供高精度量检测解决方案 [8] - 公司产品广泛应用于设备与工艺开发、硅片生产、集成电路制程、先进封装等环节 [8] - 目前,中安形貌量测设备国内装机量领先,颗粒检测设备市场推广速度迅猛 [8] 中安半导体核心技术能力 - **晶圆几何形貌量测领域**:量测系列设备具备高分辨率与高密度采样能力,可实现有图形与无图形双模式量测,精准捕捉应力分布、套刻误差、翘曲度及平坦度等关键参数,已成为行业标准解决方案 [8] - **晶圆颗粒检测领域**:构建了高灵敏度颗粒检测产品体系,设备最小检测灵敏度由26nm不断突破至10.5nm,能满足传统及先进制程客户在良率提升与工艺优化方面的核心需求 [8] 公司未来发展规划 - 公司计划推出面向更先进工艺节点的量检测解决方案,持续扩展技术边界,为集成电路产业提供更高精度、更高效率的检测与量测支持 [8]
ST新里程碑,中国产STM32正式交付
半导体行业观察· 2026-03-24 11:20
合作里程碑与本地化战略 - 欧洲MCU巨头意法半导体宣布,其与中国晶圆代工厂华虹宏力合作生产的STM32通用微控制器已开启交付,首批晶圆产品已陆续发货给国内客户,标志着公司全球供应链战略的重大进展[1] - 通过此次合作,意法半导体已成为在中国实现MCU全流程制造的国际半导体公司,打造了一条覆盖从晶圆制造到封装测试全部环节的完整本地化STM32供应链[3] - 公司执行副总裁表示,此举体现了对中国客户的核心承诺,旨在通过打造安全、可靠、更具韧性的本地化供应链,将全球同标准、同性能的产品带给中国客户[1] STM32产品市场地位与成就 - STM32系列自2007年首款产品诞生,历经19年演进,已成为全球通用MCU市场冠军,公司已推出超4000种型号MCU,覆盖五大核心系列[5] - 截至2025年12月,STM32全球累计交付量已突破150亿颗,确立了在嵌入式系统和物联网设备领域的领军地位[7] - 其成功得益于“开发者优先”策略构建的完整生态系统,以及从130nm到18nm ePCM的先进工艺,并集成边缘AI与高级安全特性[7] 中国市场深耕与本地化策略 - 意法半导体自1984年在华开展业务,已深耕超四十年,打造了“中国设计-中国创新-中国制造”的完整本地化战略,组建了本地设计团队以更了解中国客户需求[7] - 公司高管阐述“In China, For China”策略,指出只有立足本地才能快速响应需求,若选择境外制造可能错失中国工业化快速成熟的战略机遇期[13] - 与华虹的制造合作模式为客户提供了双供应链选择权,既可选用中国本地制造的MCU,也可选择海外生产的型号,且品质全球一致、完全兼容[13] 技术合作与生产细节 - 意法半导体与华虹宏力在前端晶圆制造环节已有长达十五年的合作历程,双方在2024年底宣布进一步深化长期合作伙伴关系[9] - 华虹采用与意法半导体全球晶圆厂完全一致的40纳米嵌入式非易失性存储器技术和质量管控标准,确保本地制造产品在质量和兼容性上与全球标准无缝衔接[10] - 采用相同的掩模版,公司能在欧洲或中国制造完全相同的eNVM 40纳米STM32产品,为客户提供无缝的第二货源验证过程[16] 本地化生产的具体产品规划 - 首款基于“在中国,为中国”供应链体系的STM32产品是STM32H7系列,该系列基于32位Arm Cortex-M7内核,运行频率高达600 MHz,具有单核和双核版本[16] - 部分H7系列型号已率先开始量产,更多型号计划于2026年底实现量产[17] - 由华虹代工的后续产品将是STM32H5系列和STM32C5系列,H5系列计划于2026年第二季度提供样品并于年底量产,C5系列计划于2026年底实现量产[17][18] 合作的意义与行业影响 - 此次合作打造的“双引擎”供应体系,增强了公司在复杂国际竞争态势下的风险抵御能力[3] - 合作能为开展国际业务的中国OEM厂商提供供应链选择权提高运营效率,同时为在中国开展业务的全球OEM厂商提供本地化供应链支持[16] - 率先在中国生产的MCU符合中国正在发力的终端市场,如智能工业物联网、智能家居、汽车等,将支持中国科技产业发展并赋能中国客户走向全球[8][20]
HBM,竞争激烈
半导体行业观察· 2026-03-24 11:20
HBM技术发展与竞争格局 - 随着AI需求爆炸式增长,高性能高带宽内存(HBM)及其核心逻辑芯片(基板)的重要性日益凸显,竞争日趋激烈[2] - 从第七代HBM4E开始,三星电子和SK海力士预计将通过应用先进工艺制造基板,展开性能大战[2] - 底层芯片(基片芯片)是HBM堆叠最底层的芯片,起到基座作用,直接连接到图形处理器(GPU),是连接GPU和显存的通道[2] 三星电子HBM技术策略与进展 - 三星电子采用其先进的4纳米工艺,提升了第六代HBM4显存芯片的基片芯片性能[2] - 三星电子采用了10纳米级第六代(1c)DRAM工艺和先进的芯片代工工艺,据评估其在HBM4性能方面已超越SK海力士[3] - 三星电子上个月率先在业内开始量产HBM4,其数据处理速度可达11.7Gbps,并支持最高13Gbps的传输速度[3] - 三星计划在其HBM4E芯片基础层沿用第六代产品的4纳米工艺,但计划通过提升控制电流流动的晶体管的性能,在保持能效的同时,实现16Gbps的更高性能[3] - 三星电子副总裁表示,HBM5的基础芯片将采用三星晶圆代工的2nm工艺,而HBM4和HBM4E则采用4nm基础芯片[5] - 三星电子被认为是目前唯一一家能够生产13Gbps HBM4的公司[7] - 三星通过利用其接近尖端的4nm制程工艺,并采用基于逻辑工艺的新型MIM(金属-绝缘体-金属)电容器,解决了高性能与低功耗平衡的挑战[8] - 三星的HBM4E运行速度可达16Gbps,比HBM4的13Gbps提升了23%,同时保持了相同的功耗[9] - 从HBM5(第八代)开始,三星计划采用2nm工艺制造基础芯片,核心芯片将基于10nm第六代(1C)工艺[9] SK海力士HBM技术策略与进展 - SK海力士采用了台积电的12纳米工艺制造HBM4的基片芯片[2] - SK海力士正在考虑从第七代HBM4E开始,在其芯片基础层采用台积电的3纳米工艺,以提升性能与三星竞争[3] - 该公司还计划在其DRAM芯片方面采用1c工艺,取代现有的10纳米级第五代(1b)工艺[3] - 据报道,SK海力士预计将在其HBM4E核心芯片上采用10nm级第六代(1c)DRAM工艺,而逻辑芯片则采用台积电的3nm工艺[5] - 该公司今年向NVIDIA提供的HBM4采用的是10nm级第五代(1b)DRAM核心芯片,以及基于台积电12nm工艺的逻辑芯片[5] - SK海力士和美光官方均宣称其HBM4产品的速度为“11.7 Gbps”[7] - 报告指出,HBM4E逻辑芯片根据客户具体要求设计,正在考虑多种工艺节点包括3nm和12nm,但预计3nm工艺仍将主导生产[6] 市场趋势与客户需求 - 从第七代芯片开始,“定制化HBM”市场将真正开放,客户需要根据应用需求定制产品,以提高能效和性能[3] - 这将增加对采用更细线宽的基础芯片的需求,以便添加一些逻辑功能,从而提升计算性能和能源管理效率[3] - 下一代HBM芯片的趋势是采用先进工艺的基础芯片,以实现客户所需的每瓦性能或性能[3] - 随着HBM4E的推出,定制HBM市场(即根据客户特定电路需求定制逻辑芯片)有望全面腾飞[5] - 如今的HBM客户要求同时具备高性能和低功耗[7] - HBM4E预计将于明年集成到NVIDIA即将推出的“Vera Rubin Ultra”AI加速器中[8] - HBM4E目前正在进行内部评估,计划于今年第三季度寄出样品,并于第四季度开始量产[8] - HBM4E将应用于NVIDIA的下一代AI芯片Vera Rubin Ultra[6] - 台积电的C-HBM4E逻辑芯片将从目前的12纳米HBM4逻辑芯片过渡到N3P节点,电压从0.8 V降至0.75 V[6] 竞争态势与市场份额 - 三星电子执行副总裁表示,公司的立场是大幅增加向NVIDIA供应的高端HBM4[7] - 其所指的“高端HBM4”是一款高性能产品,运行速度高达13Gbps,远超NVIDIA 10-11Gbps或更高的要求,并称100%的产品都是高性能的[7] - 如果三星扩大对英伟达的高性能HBM4供应,其在英伟达的HBM4市场份额可能超过业界普遍预期的30%[7]
黄仁勋三万字采访:展望10万亿市值,3万亿营收
半导体行业观察· 2026-03-24 11:20
公司核心战略与成功之道 - 公司的成功很大程度上归功于其领导者作为工程师和创新者所展现出的强大意志力和卓越决策 [2] - 公司的目标已从打造最好的GPU扩展到对GPU、CPU、内存、网络、存储、电源散热、软件、机架乃至整个数据中心进行极致的协同设计和机架级工程 [2] - 极致协同设计的必要性源于需要解决的问题已无法用单台计算机或单个GPU加速解决 目标是实现比单纯增加计算机数量更快的速度提升 例如增加1万台计算机但希望速度提升一百万倍 [2] - 极致协同设计涉及对整个软件栈进行优化 从架构、芯片、系统、系统软件、算法到应用程序 同时还需协同设计CPU、GPU、网络芯片、交换机、电源和散热等所有组件 [4] - 公司的组织架构直接反映了其产品目标和所处的技术环境 旨在成为生产产品的机器和系统 [4] - 公司采用独特的协作模式 领导者有约60名直接下属且几乎都与工程相关 会议避免一对一 而是集体讨论解决问题 任何关于特定组件的讨论都向所有相关专家开放 鼓励跨领域提出意见 [5] 从加速器到计算平台的演进 - 公司最初是一家加速器公司 但意识到高度专业化会限制市场规模和研发能力 从而影响在计算领域的影响力 [6] - 公司战略是找到一条狭窄的道路 逐步拓展计算能力 同时不放弃核心的专业优势 [6] - 迈向计算平台的关键第一步是发明了可编程像素着色器 第二步是创建了符合IEEE标准的FP32着色器 这吸引了流处理器等领域的开发者 [7] - 为了成为一家计算机公司并建立自己的计算架构 公司做出了一个关键的战略决策:将CUDA集成到面向消费市场的GeForce显卡中 尽管这大幅增加了成本并侵蚀了利润 [7] - 将CUDA集成到GeForce的决定使公司市值从约80亿美元一度跌至15亿美元左右 但最终被证明是公司历史上最英明的决定之一 为人工智能基础设施奠定了基石 [10] - 该决策基于一个核心洞察:计算平台的成功关键在于安装基础(用户群)而非单纯的架构优劣 CUDA通过GeForce建立了庞大的用户基础 [8][9] - 公司通过向大学赠书、开课等方式推广CUDA 最终研究人员和科学家在GeForce显卡上发现了CUDA 并利用其搭建集群 为深度学习革命奠定了基础 [10] 领导力与决策哲学 - 领导者的许多想法源于好奇心 会形成一套逻辑体系让自己确信某个未来一定会发生 并坚信不疑 [11] - 领导者不采用突然宣布重大变革的方式 而是通过日常沟通 利用外部信息、新见解和工程突破 逐步塑造董事会、管理团队和员工的信念体系 当正式宣布时 大家已基本认同 [12] - 这种“幕后领导”的方式也应用于影响行业合作伙伴 例如在GTC主题演讲中塑造行业信念 为产品发布铺平道路 [13] - 公司是一家计算平台公司 采用垂直整合方式设计优化 但将平台的每一层都开放给其他公司集成 因此需要先说服合作伙伴才能开展工作 [14] - 领导者采用名为“光速”的思维方法论 在做任何事前先确定所有事物的物理极限 并用这些极限来测试和权衡设计 追求从第一性原理出发 而非仅仅持续改进 [40][41] 人工智能扩展定律与未来展望 - 公司相信并持续关注多个维度的扩展定律 包括训练前、训练后、测试时间和智能体扩展 [14][15] - 最初人们担心高质量数据量会限制预训练扩展 但公司认为用于训练的数据量将持续扩大 其中很多将是合成数据 最终训练将受限于计算能力而非数据 [15][16] - 公司认为推理(测试时间)是比预训练更困难的计算任务 涉及思考、推理、计划和搜索 因此需要巨大的计算量 [17] - 下一个扩展定律是智能体扩展定律 智能体系统可以派生出大量子智能体 产生更多数据和经验 形成从数据到预训练、后训练、测试再到应用的循环 智能发展的根本限制是计算能力 [18][19] - 为了预测硬件需求 公司进行内部研究和模型开发 并与全球所有人工智能公司合作 了解挑战 同时保持CUDA架构在专业化和灵活性之间的平衡以适应算法变化 [19][20] - 公司快速迭代硬件架构以跟上算法发展 例如为混合专家模型推出NVLink 72 Grace Blackwell机架专为处理LLM设计 而一年后的Vera Rubin机架则专为运行智能体及与工具交互设计 [21] 供应链、能源与工程挑战 - 公司历史上在保持增长的同时还能加速增长 在人工智能计算领域的市场份额正在扩大 因此供应链(包括上游和下游)至关重要 [28] - 领导者花费大量时间与IT行业上下游基础设施公司的CEO们沟通 解释增长动力和未来方向 以指导他们的投资决策 [28] - 公司成功说服了DRAM行业的CEO投资研发HBM内存 尽管其最初使用率很低 并推动将手机低功耗存储器改造用于数据中心超级计算机 [29][30] - 公司最新的机架系统包含130万个组件 由约200家供应商提供技术支持 [30] - 随着系统架构演进 公司将数据中心的超级计算机集成转移到了供应链中的制造环节 这要求供应链增加电力供应以完成制造和测试 [31] - 公司认为电网在99%的时间里有过剩的闲置电力 提议通过设计能够优雅降级的数据中心 利用这些剩余电力 在电网需要时降低数据中心负载 [34][35] - 解决电力瓶颈需要提高每瓦每秒产生的token数量以提升效率 同时公司也致力于降低token成本 其每年下降一个数量级 [28] 竞争护城河与生态系统 - 公司最重要的资产是其计算平台的安装基础 尤其是CUDA的安装基础 这源于公司长期持续的投入、数百万开发者的信任以及庞大的软件库 [56] - 开发者选择CUDA是因为其能带来显著的性能提升(例如十倍) 并能触及数亿用户和计算机 遍布所有云平台、计算机公司、行业和国家 [56] - 公司不仅垂直整合了复杂的系统 还将其水平整合到每一家公司的计算机中 与谷歌云、亚马逊云、Azure、CoreWeave等广泛合作 生态系统覆盖几乎所有行业 [57] - 公司的业务单元已从GPU演进到计算机、集群 再到完整的AI工厂 领导者对未来产品的构想是巨型千兆瓦级装置 [58] - 公司已开始涉足太空计算 GPU已进入太空 用于卫星边缘的AI成像处理 [60] 市场前景与增长潜力 - 计算范式已从基于检索的文件系统转变为基于生成的、需要实时处理token的上下文感知系统 新范式需要比旧世界多得多的处理能力 [63] - 计算机正从“仓库”转变为“工厂” 其产出的token是能创造收入和利润的商品 智能成为一种可扩展的产品 不同价值的token将出现细分市场 [64] - 有人愿意为每百万个token支付1000美元的想法指日可待 [65] - 世界GDP将因生产力提高而加速增长 用于计算的GDP占比可能比过去增长100倍 因为计算已成为产品创造而不仅仅是存储 [65] - 公司有可能在不久的将来成为一家年收入3万亿美元的公司 这不受物理限制 且其供应链生态系统有能力支持这种规模扩张 [66] - 公司增长的最大挑战在于其并非从竞争对手那里抢占市场份额 而是在开拓一个全新的、巨大的市场 这需要行业对未来的想象力 [66]
基板缺货潮要来了?
半导体行业观察· 2026-03-24 11:20
公司产能扩张计划 - LG Innotek计划将半导体基板产能翻一番,因现有设施已满负荷运转且市场需求强劲 [2] - 公司预计将在2024年上半年就新的扩建厂址做出决定 [2] - 现有核心基板生产线已满负荷运转,服务器相关半导体基板预计于2025年下半年实现满负荷生产 [2] 产品组合与生产规划 - 公司目前生产玻璃纤维基板和无玻璃基板,业务正从以玻璃纤维基板为主拓展产品组合 [2] - 部分服务器基板预计将于2025年投入量产,采用先进内部基板结构的高附加值产品预计于2025年底或2026年实现商业化 [2] - 高附加值产品预计到2028年左右将产生显著的营收贡献 [2] 财务表现与业务结构 - 2023年公司营收达20.6万亿韩元,营业利润达8300亿韩元 [2] - 光学解决方案(主要为摄像头模组)贡献约14万亿至15万亿韩元营收,占总营收70%以上 [2] - 基板材料业务贡献约4万亿韩元,汽车零部件业务贡献约2万亿韩元 [2] - 公司正逐步将业务重心从以摄像头为中心的结构转向基板和汽车零部件领域 [2] 盈利趋势与业务策略 - 公司盈利具有明显的季节性特征,通常下半年业绩更为强劲 [3] - 预计2024年上半年业绩将比去年同期有所改善,部分原因是折旧负担减轻 [3] - 公司正在调整盈利策略,从简单的零部件供应转向软件集成,并计划拓展一级供应商服务以提升价值 [3] 新业务发展:机器人 - 人形机器人组件已进入初步量产阶段,目前已有数百套设备部署在工厂进行测试和优化 [3] - 大规模生产预计将在2027年后启动,具体时间取决于客户进度 [3] - 这些产品是集成了摄像头、激光雷达和雷达的感知模块,而非独立的摄像头单元 [3] - 机器人技术要达到可观的收入(至少需要数千亿韩元)可能还需要三到四年时间 [3] 汽车业务增长 - 汽车业务正进入增长阶段,公司位于光州的工厂正在生产自动驾驶应用处理器模块 [4] - 预计2024年下半年汽车业务营收将大幅增长 [4] - 汽车零部件业务预计将以每年约20%的速度增长 [4] 投资与股东回报策略 - 在投资策略方面,公司优先考虑与拥有软件能力的公司建立合作关系,而非进行大规模并购 [4] - 公司正在与自动驾驶公司合作,预计很快将发布相关公告 [4] - 公司计划在投资的同时维持股东回报,拥有充足的现金流来支持投资和分红,目标是随着时间的推移提高股息支付率和股息总额 [4]
比亚迪5分钟极速充电,震惊美媒
半导体行业观察· 2026-03-24 11:20
比亚迪闪充技术突破 - 公司最新闪充技术可在5分钟内将部分电动汽车电池电量从10%充至70%,并在9分钟左右充满,充电期间可增加超过600英里续航里程 [2] - 新型闪充桩可提供高达1500千瓦的功率,远超美国常见的350千瓦“超快”充电器,后者将电池充至80%需15至25分钟,充满约需40分钟 [2] - 该技术使充电体验更接近传统加油,有助于缓解潜在电动汽车买家对续航和充电的担忧,可能促使更多驾驶员考虑使用充电桩 [2] 技术实现与产品应用 - 目前仅比亚迪旗下腾势Z9GT车型可体验此超高速充电,该车将于下月在巴黎车展首次亮相 [3] - 高速充电的实现依赖于公司最新一代的Blade电池,该电池采用了磷酸锰铁锂技术以提高能量密度,公司重新设计了包括电极、电解液和隔膜在内的所有电池元件 [3] - 改进后的电池能量密度比去年宣称的最新款提升了5%,搭载该电池的腾势Z9GT宣称单次充电续航里程可超过620英里 [4] 充电基础设施部署 - 公司已在中国建成超过4000个充电桩,并计划在年底前再建约16000个,此外还计划在欧洲建设2000个充电桩 [2] - 新型充电桩为蓝绿色T型系统,设计类似加油站油泵,公司将把其整合到现有充电桩系统中以简化推广部署 [5] - 公司将在充电站配备储能电池,以补充电网负荷并防止电网过载 [5] 技术推广的挑战与局限性 - 有观点认为,该技术是一项微小的技术进步,不会改变大多数人的日常生活,因为许多电动汽车车主主要在家充电,仅偶尔使用公共快充,5分钟与20分钟的充电时间差异对他们影响不大 [5] - 超快充电技术的推广受电网容量限制,需要全新的“管道”和大量时间、资金及协调工作,仅更换充电桩硬件无法实现更快充电速度 [6] - 目前美国的兆瓦级充电站主要服务于重型卡车,而非普通乘用车 [6] 行业背景与市场动态 - 美国电动汽车市场面临挑战,本田取消了三款即将上市的电动汽车,现代和起亚停产了一些纯电动汽车,兰博基尼也搁置了电动汽车项目 [6] - 特朗普政府取消了对电动汽车的联邦支持,并反对加州制定自己的空气污染标准,而加州的标准曾用于促进零排放汽车销售 [6] - 当中国和欧洲在充电技术方面领先时,美国似乎还在起跑线上徘徊 [6]