边缘AI
搜索文档
存储再度爆发!AI推理与多模态驱动数据爆炸,硬盘和闪存厂商将成最大受益者
华尔街见闻· 2026-01-07 09:51
核心观点 - AI发展正从资本支出驱动的模型训练阶段,转向以投资回报率为核心的推理应用阶段,这一转变正在引发市场对存储板块的价值重估,存储被视为承载“AI工作记忆”的关键,相关公司股价已出现显著上涨 [1][2] AI浪潮推动存储价值重估 - 英伟达CEO黄仁勋指出,AI存储是一个“完全未被开发的市场”,很可能成为全球最大的存储市场,承载全球AI的工作记忆 [1] - 英伟达展示了针对代理AI推理优化的新存储平台,承诺比传统平台提高五倍的能效 [1] - 市场对存储板块的重估源于AI工作负载从训练向推理的转变,以及多模态AI带来的数据爆炸 [4][7] - 2026年预计将成为企业级和边缘AI的拐点,AI推理将占据主导地位,推动存储需求同步飙升 [1][7] 数据爆炸与存储需求 - 全球年度数据生成量预计将从2024年的173 ZB飙升至2029年的527 ZB,五年内增长两倍以上,复合年增长率约为25% [4] - 多模态生成式AI需要处理和生成图像、视频、音频等非结构化数据,这些数据体积庞大且需要频繁读写,使存储成为AI计算流程中不可或缺的活跃参与者 [7] - 企业为训练、分析和合规目的需要保留越来越多数据,直接推高了存储需求 [7] 硬盘(HDD)市场的机遇 - 机械硬盘凭借成本优势和容量密度,在海量数据存储领域地位不可替代 [8] - 多模态AI和推理需求增加将直接推动硬盘出货量增长,并促使客户转向更高容量的驱动器,提升希捷和西部数据的每TB价值 [8] - 希捷的HAMR技术和西部数据的UltraSMR技术旨在满足对单盘容量和能效的极致追求 [10] 闪存(NAND)与边缘AI的机遇 - AI推理过程需要存储提示词、反馈标签、安全日志及用于检索增强生成的向量数据库,这需要大量随机I/O和写入操作,推高了高性能企业级SSD的需求 [10] - 边缘AI在手机、PC、汽车等终端设备上直接运行,要求极低延迟和高可靠性,推动了存储介质向高性能UFS和NVMe接口转移 [9][10] - 闪迪作为嵌入式和可移动闪存领导者,将受益于单设备存储容量提升和产品结构升级 [10] - 苹果凭借庞大的设备基数、自研芯片和对隐私的追求,被视为“终极边缘AI玩家”,能通过端侧AI提供快速、安全的体验 [10] - 戴尔和惠普将受益于企业对“AI PC”的换机需求,Gartner预测2025年AI PC将占所有PC出货量的43% [10] 供给紧张与价格展望 - 随着AI训练和推理需求增长,存储供应趋紧,价格正在飙升 [12] - 三星电子和SK海力士正寻求在第一季度将服务器DRAM价格较去年第四季度上调60%至70% [12] - 硬件支出在IT行业的收入占比自2022年以来逐年上升,行业正在进入一个“硬件复兴时代” [12] - 在此周期中,提供“记忆”的存储厂商,以及提供连接的安费诺和康宁,都将成为AI推理浪潮的核心受益者 [12] 市场表现 - 周二美股存储概念股集体飙升,闪迪暴涨27.56%,创下自2月以来最佳单日表现 [1] - 西部数据和希捷科技分别大涨16.77%和14.00% [1]
CES2026:AMD发布新一代P100嵌入式处理器
新浪财经· 2026-01-07 09:51
产品发布与定位 - 公司在CES展会上正式发布锐龙AI嵌入式P100系列,并介绍了锐龙AI嵌入式X100系列,两大系列产品主要应对边缘AI市场的需求 [1][5] - 产品覆盖人工智能、汽车辅助驾驶、医疗、机器人等多个领域,旨在提供高性能、高精度、快速响应与低功耗的解决方案 [1][5] 锐龙AI嵌入式P100系列技术规格 - 该系列采用4纳米制程工艺,CPU提供4-6个核心,配备1MB L2缓存及8MB L3缓存,集成10GbE w/TSN与Infinity Fabric,功耗范围为15-54W,并支持长达十年的全天候高强度运行生命周期 [1][5][6] - CPU基于Zen 5架构,在SPECrate@2017测试中,单线程与多线程性能相较于上代提升2倍以上 [1][6] - GPU搭载RDNA 3.5架构,渲染性能提升35%,支持4K-8K高保真显示与低时延流式播放 [2][6] - 内置基于XDNA2架构的NPU核心,提供30-50 TOPS的专用AI算力,支持视觉、音频、自适应用户界面实时加速,并兼容TensorFlow等开源框架 [2][6] - 公司已为部分用户提供P100系列样片,并计划后续推出最高12核心的型号,以满足工业自动化等场景的更高需求 [2][6] 锐龙AI嵌入式X100系列信息 - 该系列尚未正式发布,计划于2026年下半年开始供货,主要覆盖从个人用户到完整机器学习的需求,并适配自主系统场景 [2][7] 软件生态与支持 - 公司基于开源理念构建软件堆栈,支持Yocto、Ubuntu等开源系统,并兼容RTOS、微软、安卓等操作系统 [4][7] - 提供丰富的AI优化库、工具及开发者熟悉的图形API,旨在降低客户定制化成本,加速在工业、汽车等场景的落地 [4][7] 实际应用场景 - 在汽车领域,产品可用于下一代数字座舱,由Zen 5 CPU负责控制逻辑,GPU支持双屏4K显示,NPU实现实时语音手势交互 [4][7] - 在工业领域,CPU提供确定性性能,GPU支持4K-8K可视化,NPU用于设备故障预警与健康状态总结,10GbE w/TSN保障确定性数据抓取 [4][7] - 产品同样适用于零售服务终端、医疗患者监测、测试测量信号可视化等需要可视化与智能交互的场景 [4][7] 量产时间与产品亮点 - 锐龙AI嵌入式P100系列芯片的大规模量产计划于2026年第二季度启动,参考板量产将于2026年下半年推进 [5][8] - 该系列最大亮点在于Zen 5 CPU、RDNA 3.5 GPU与XDNA2 NPU的异构三核心架构协同工作,在低功耗基础上实现了性能与AI算力的双重突破 [5][8]
今年CES,芯片厂商又开始“神仙打架”
36氪· 2026-01-07 08:42
文章核心观点 - 本届CES展会是芯片产业的技术风向标,展示了三大核心趋势:AI已渗透技术金字塔的每一层,物理AI和边缘AI是两大竞争关键;汽车电子步入“集中化+软件定义”深水区,跨域融合成为行业必然趋势;生态竞争取代单点技术比拼,协同合作联合定义产品成为制胜关键 [33] 德州仪器 (TI) - 发布三款汽车新品:L3跨域融合SoC TDA5系列、单芯片8发8收雷达发射器AWR2188、全新10BASE-T1S以太网串行外设接口PHY DP83TD555J-Q1 [1] - TDA5系列SoC算力极为强大,最高达1200TOPS,能效比超24 TOPS/W,AI算力较前代产品最高可提升12倍,采用UCIe接口增强扩展性,并与新思科技合作推出虚拟开发套件 [1] - AWR2188是业界首个单芯片8发8收雷达方案,性能较现有解决方案提升30%,能对距离>350米的目标实现高精度探测 [4] - DP83TD555J-Q1是首款10BASE-T1S产品,具有纳秒级时间同步能力,支持数据线供电,可降低线缆设计复杂度和成本 [7] 亚德诺半导体 (ADI) - 在汽车、消费、机器人三大领域展示方案 [10] - 汽车领域展示最新A²B 2.0方案,带宽比1.0版本高4倍,并展示利用E²B和LED驱动器的车灯方案、GMSL技术、无线BMS方案等 [10] - 消费领域与IDUN Technologies合作开发AI直接响应人体大脑与身体信号的演示,并在AR眼镜展示并联电池管理方案 [10] - 机器人领域展示视觉赋能的自主机器人仿生手、高精度轮驱运动控制方案、3D深度感知、以及为独轮机器人展示的六自由度IMU [11] 恩智浦 (NXP) - 发布S32N7超高集成度处理器系列,采用5nm技术平台,包含32个兼容型号,可在一颗芯片上实现动力总成、车辆动态控制、车身、网关和安全域 [12] - 该处理器通过减少数十个硬件模块,帮助汽车制造商大幅简化车辆架构,总体拥有成本最高可减少20% [12] - 算力包括8个分锁Cortex-A78AE@1.8 GHz、12个分锁Cortex-R52@1.4 GHz、eIQ NPU等,存储支持LPDDR4X/5/5X、36MB SRAM等 [15] 微芯科技 (Microchip) - 展示大量Demo,重点包括适用于高通Ride平台的ASA Motion Link方案,以及基于10BASE-T1S的无软件式智能大灯 [17] - ASA-ML方案展示四颗ADAS摄像头通过该技术无缝连接至高通Snapdragon Ride平台 [17] - 10BASE-T1S无软件大灯搭载欧司朗25K像素ULED,由端点直接渲染视频流,降低了中央计算机复杂度并构建了硬件抽象层 [18] 芯科科技 (Silicon Labs) - 推出适用于Zephyr的新Simplicity SDK,这是一种经过严格审核的Zephyr代码库快照,可完全访问公司标准技术支持渠道 [19] - 展演了蓝牙信道探测和使用人工智能/机器学习进行的单芯片无线电机控制 [19] 英飞凌 (Infineon) - 联合Flex展示一款为区域控制单元设计的模块化开发套件,旨在加速面向软件定义汽车的电子/电气架构开发 [20] - 该套件支持所有核心区域控制功能,预验证硬件集成了英飞凌的AURIX微控制器、OPTIREG电源、PROFET等产品,软件栈得益于Vector的贡献 [20] 意法半导体 (ST) - 与帕加尼和Osdyne合作推出Osdyne Automotive Gateway,利用了ST的Stellar SR6 G系列MCU,实现了车内和车到X的通信路由与防火墙、诊断、遥测、远程监控及空中更新等功能 [22] - 该网关旨在集中计算,以大幅减少线束数量,同时提供更多功能和更好性能 [22] - 也展示了在人形机器人方面的应用合作 [24] 安霸 (Ambarella) - 发布CV7端侧AI视觉感知SoC,采用4nm制程,专为多元AI感知场景深度优化,应用包括8K消费级智能产品、安防监控、机器人、工业自动化及视频会议系统 [25] - 相较于上一代产品,CV7在同等负载下的功耗降低20%以上,AI性能较上一代CV5 SoC提升超过2.5倍,并支持卷积神经网络与Transformer网络协同运行 [25] 英伟达 (NVIDIA) - 发布大量革命性产品,包括首次亮相的Rubin平台,该平台包含Vera CPU、Rubin GPU等六款新芯片 [26] - 汽车方面推出NVIDIA Alpamayo系列开源AI模型、仿真工具及数据集,以及完全开源的端到端仿真框架AlpaSim和超过1700小时驾驶数据的物理AI开放数据集 [26] - 机器人方面推出Jetson T4000平台,提供高达1200 FP4 TFLOPs的AI计算和64 GB内存 [26] 英特尔 (Intel) - 第三代英特尔酷睿Ultra处理器正式发售,成为首款基于Intel 18A制程节点的产品 [27][28] - Intel 18A采用RibbonFET和PowerVia技术,可在相同功耗下提升芯片性能超过15%,或在相同性能下降低功耗25%以上,晶体管密度提升30% [28] - 集成Arc GPU的全新酷睿Ultra X9在1080p高画质下,45款游戏的平均帧率对比前代平台提升高达77% [28] 超威半导体 (AMD) - 发布多款重磅新品,包括全新AI芯片MI455X GPU、Ryzen AI 400系列处理器、AMD Ryzen AI Max+系列处理器以及AMD AI开发平台Ryzen AI Halo [29] - MI455X拥有3200亿晶体管和432GB HBM4内存 [29] - 首批Ryzen AI 400 PC计划本月晚些面市,全年计划推出超过120款设计,Ryzen AI Halo平台预计第二季度上市 [29] - 公司强调是唯一拥有GPU、CPU、NPU全栈计算引擎的公司,过去四年已将AI性能提升1000倍 [30] Arm - 特别关注物理AI、边缘AI发展,认为其智能化演进与深度融合将成为AI领域发展的核心动能 [31] - 携手合作伙伴围绕五大应用场景展示前沿趋势:自动驾驶、机器人、PC/笔记本电脑/平板、可穿戴设备、智能家居 [31] - 预计到2026年,各大主流OEM计划推出的相关PC等机型将超过100款 [32]
AMD的第三大支柱
半导体芯闻· 2026-01-06 18:30
文章核心观点 - AMD在PC和数据中心市场之外,正将嵌入式产品打造为公司的第三大支柱业务,以抓住边缘AI和智能化带来的市场机遇 [1] - 嵌入式系统的需求正从传统的微控制器向高性能、高集成度的微处理器转变,特别是AI的普及带来了新的增长变量 [3] - AMD发布了全新的锐龙AI嵌入式P100系列处理器,该系列集成了最新的CPU、GPU和NPU架构,旨在为边缘AI应用提供强大的软硬件支持 [12] 嵌入式市场需求演变 - 嵌入式系统定义:一种嵌入机械或电气系统内部、具有专一功能和实时计算性能的计算机系统,用于高效控制常见设备(如汽车防锁死刹车系统)[3] - 需求变化:终端需求变化推动嵌入式系统向更复杂、更高性能发展,催生了更多高性能微处理器的需求 [3] - AI带来的新机会:AI普及成为嵌入式系统的新变量,为AMD等高性能芯片供应商带来机会 [3] - 边缘AI应用广泛:智能向边缘侧转移,市场需求涵盖自主机器(如辅助驾驶、机器人)和交互式体验(如信息娱乐系统、医疗)两大方面 [5] - 系统面临的共同挑战:包括对实时响应(可靠性、低时延、不依赖云)、混合工作负载(传感器融合、可视化、AI推断等并行)和可扩展性的要求 [6] - 最终用户新需求:追求高保真多屏显示与沉浸式交互、行为感知个性化(识别用户意图)、以及确定性的持续性能 [6] - 对处理器的要求:硬件需应对高性能、高频率及可靠性挑战,软件面临空前的复杂度 [7] AMD的嵌入式业务基础与新产品发布 - 业务基础:AMD面向嵌入式市场提供锐龙嵌入式处理器和EPYC处理器,已拥有超过7000家嵌入式客户 [9] - 产品核心特点:长使用寿命和可靠性(约十年生命周期,适应严格散热要求);提供容错功能、嵌入式专有连接、RAS安全启动等芯片特性;提供开源固件及长期操作系统支持的软件栈 [9][10] - 新产品发布:AMD发布了锐龙AI嵌入式P100系列,这是一系列全新的x86嵌入式处理器,旨在为边缘AI驱动应用提供强大动力 [12] - 硬件架构集成:集成了高性能的“Zen 5”CPU核心架构、RDNA 3.5 GPU(用于实时可视化和图形处理)以及XDNA 2 NPU(用于AI加速)[14] - GPU性能:RDNA 3.5 GPU的渲染速度预计提升35%,可同时驱动多达四个4K或两个8K显示器(帧率高达120帧/秒)[14] - NPU性能:下一代AMD XDNA 2 NPU可提供高达50 TOPS的性能,AI推理性能提升高达3倍,并能结合对语音、手势和环境线索的理解 [15] - 软件支持:提供一致的开发环境,统一的软件栈涵盖CPU、GPU和NPU,构建于开源的、基于Xen虚拟机管理程序的虚拟化框架之上,可安全地隔离并并行运行多个操作系统 [17][19][20] - 产品规格与分类:P100系列包含不同型号,分为工业级温度(如P121i, P132i)和车规级(如P122a, P132a)等类别,在CPU核心数、频率、NPU算力(30或50 TOPS)、内存支持及工作温度范围上有所区别 [21] - 封装与应用:采用紧凑的BGA(球栅阵列)封装,适用于空间受限的系统,能为汽车座舱、工业、瘦客户机、协作系统、测试测量等行业提供高效算力支持 [21] AMD的战略优势与市场展望 - 市场机会:快速发展的边缘AI市场存在大量机会,对高性能人工智能的需求不断增长,例如机器人应用需要强大的处理能力 [23] - 公司独特优势:AMD拥有面向PC和数据中心的既定路线图,以及在CPU、GPU、NPU和定制加速器方面的广泛布局,使其能够将高端技术适时引入嵌入式产品组合,支持多样化应用需求 [23]
TI发布TDA5:算力高达1200TOPS
半导体行业观察· 2026-01-06 09:42
公众号记得加星标⭐️,第一时间看推送不会错过。 日前,TI发布了使用5nm工艺打造的自动驾驶汽车的"大脑"TDA5,也是德州仪器(TI)全新解决方案 的核心。应用这款芯片,即可构建"边缘AI"环境,将每秒运算速度从10万亿次(1 TOPS;1 TOPS为 每秒1万亿次运算)提升至高达1200万亿次(1200 TOPS)。TI表示,这使得车辆即使在面对复杂多变的 道路环境时,也能快速分析数据并做出响应,从而实现L3级自动驾驶。 能效也是一大优势。该芯片每瓦功耗 (W) 可支持 24 TOPS 的计算能力。德州仪器 (TI) 处理器产品 机构部门负责人(副总裁)Roland Schupfli 表示:"对于电动汽车而言,单次充电续航里程是一项关 键指标,因此需要功耗更低、性能更高的芯片。"他补充道:"TDA5 拥有业界最佳的能效。" 为了实现低功耗、高性能的 TDA5 芯片,德州仪器集成了其神经处理单元 (NPU) 产品 C7。副总裁 Schupfli 表 示 : " 我 们 在 保 持 功 耗 相 近 的 情 况 下 , 实 现 了 比 上 一 代 产 品 高 出 12 倍 的 AI 计 算 性 能。"他还补充道 ...
国民技术二度递表港交所 为平台型MCU领先企业
智通财经· 2025-12-30 08:56
公司上市申请与基本信息 - 国民技术股份有限公司于2024年12月29日向港交所主板提交上市申请,独家保荐人为中信证券 [1][26] 公司业务与市场地位 - 公司是一家平台型集成电路设计公司,为智能终端提供控制芯片与系统解决方案,产品应用于消费电子、工业控制和数字能源、智慧家居、汽车电子与医疗电子等多个领域 [5] - 按2024年收入计,公司在全球平台型微控制器单元市场中,于中国企业中名列前五;在全球32位平台型MCU市场中,于中国企业中名列前三;在内置商业密码算法模块的中国MCU市场中排名第一 [5] - 公司自2000年成立,从专业市场芯片向通用MCU及边缘AI计算等高端产品发展,并于2023年延伸出BMS芯片、射频芯片等产品体系,2024年开始产生收入 [5] - 公司于2019年作为首家Fabless集成电路设计公司,率先实现通用MCU产品基于40纳米eFlash制程的量产 [6] - 除芯片业务外,公司同步发展锂电池负极材料业务,以人造石墨为核心,并探索硅碳复合材料及硬碳结构等多技术路线,应用于新能源汽车、储能系统与便携式设备 [6] - 公司积极探索电池管理系统控制芯片与锂电池负极材料在同一客户体系内的协同应用,构建智能能源控制平台 [6] 财务表现 - 2022年、2023年、2024年及2025年前九个月,公司收入分别约为11.95亿元、10.37亿元、11.68亿元、9.58亿元 [9] - 同期,公司毛利分别约为4.26亿元、1801.1万元、1.82亿元、1.83亿元 [10] - 2022年、2023年、2024年及2025年前九个月,毛利率分别为35.6%、1.7%、15.6%、19.1% [11] - 2022年、2023年、2024年及2025年前九个月,公司录得年内亏损分别为1893万元、5.94亿元、2.56亿元、7574.6万元 [12] - 2022年、2023年、2024年及2025年前九个月,每股基本亏损分别为人民币0.06元、1.00元、0.40元、0.13元 [12] 行业概览与市场前景 - MCU是连接感知与执行、实现终端智能化的核心元件,其性能决定智能终端感应、处理及回应环境的有效性 [13] - 全球MCU市场规模从2019年的198亿美元增长至2024年的299亿美元,年复合增长率达8.6%,预计将以9.9%的年复合增长率增至2029年的480亿美元 [13] - 用于边缘AI场景的全球MCU市场预期由2024年的7亿美元增至2029年的27亿美元,年复合增长率为31.0% [16] - 用于机器人领域的全球MCU市场预期由2024年的3亿美元增长至2029年的9亿美元,年复合增长率为27.4% [16] - 用于新能源应用的全球MCU市场预期由2024年的5亿美元增长至2029年的22亿美元,年复合增长率为32.3% [16] - 用于低空经济应用的全球MCU市场规模预计将由2024年的3亿美元增至2029年的8亿美元,年复合增长率为19.5% [16] - 中国MCU芯片市场规模从2019年的人民币368亿元提升至2024年的人民币633亿元,年复合增长率达11.5%,预计将以12.0%的年复合增长率增长至2029年的人民币1114亿元 [17] - 中国智能终端市场需求增速领跑全球,MCU市场增速明显领先全球市场 [20] 公司治理与股权架构 - 董事会由七名董事组成,包括三名执行董事、一名非执行董事及三名独立非执行董事 [21] - 执行董事包括董事长兼总经理孙迎彤先生、执行董事兼副总经理闢玉伦先生、执行董事兼副总经理及董事会秘书叶艳桃女士 [22] - 非执行董事为周斌先生,独立非执行董事为陈卫武先生、郝丹女士及吉杏丹女士 [23] - 截至2025年12月22日,董事长孙迎彤先生拥有公司已发行股本总额约2.65%的权益,为公司的单一最大股东 [24] 中介团队 - 独家保荐人法律顾问为年利达律师事务所(香港及美国法律)与金杜律师事务所(中国法律) [28] - 审计师及申报会计师为德勤 关黄陈方会计师行 [29] - 行业顾问为灼识企业管理咨询有限公司 [30] - 合规顾问为南华融资有限公司 [31]
TPU、LPU、GPU-AI芯片的过去、现在与未来
2025-12-29 09:04
行业与公司 * **行业**:人工智能(AI)芯片行业,涵盖图形处理器(GPU)、张量处理器(TPU)、语言处理器(LPU)等专用芯片 [2] * **涉及公司**: * **NVIDIA**:GPU及CUDA生态主导者 [2][3] * **Google**:TPU的研发者与推动者 [2][5] * **Groq**:LPU的初创公司,由前TPU团队成员创立 [2][7] 核心观点与论据 * **历史演进:从通用到专用** * **GPU**:从图形处理转向AI计算基石,NVIDIA创始人黄仁勋的远见在于构建CUDA生态,使其通用化 [2][3];2012年AlexNet在ImageNet竞赛中以15.3%的错误率击败第二名(26.2%),成为GPU在深度学习领域崛起的引爆点 [4] * **TPU**:源于Google对算力危机的“未雨绸缪”,2013年预测若每位安卓用户每天使用3分钟语音搜索,需将数据中心容量翻倍 [5];采用脉动阵列架构以打破冯·诺依曼瓶颈,提升AI计算效率 [6] * **LPU**:由前TPU团队成员再创业推出,理念是进一步“专用化”,专注于语言处理,旨在推动“AI for Everyone”,通过确定性执行架构提供可预测的低延迟推理 [7][8][9] * **架构与性能对比** * **架构核心**: * GPU:CUDA核心 + Tensor Core并行处理架构 [11] * TPU:脉动阵列专用设计 [12],如256x256 MAC单元阵列 [13] * LPU:确定性执行可编程流水线 [14],采用片上SRAM高速存储 [17] * **性能对比**(以LPU、NVIDIA H100 GPU、Google TPU v4/v5为例): * **内存与带宽**:LPU使用约230MB片上SRAM,带宽达80TB/s;GPU使用80-96GB HBM3,带宽约8TB/s;TPU使用片上高带宽内存 [14] * **延迟**:LPU为确定性极低延迟(<100ms),GPU延迟可变且较高(200-1000ms),TPU针对特定负载优化 [14] * **功耗效率**:LPU高效(约1W per token/s),GPU功耗非常高(250-700W+),TPU v5比前代性能功耗比提升67% [14][231] * **软件生态**:GPU拥有成熟的CUDA、TensorRT生态;TPU与TensorFlow/JAX深度集成;LPU为新兴生态(Groq API) [14] * **主流模型适配** * **GPU**:适配GPT-5(通过NVLink集群训练)、Claude(PyTorch支持)、LLaMA(CUDA生态成熟)等模型 [18] * **TPU**:适配Gemini(1e26 FLOPS TPUv5 Pod训练)、PaLM(TensorFlow深度优化)及Google内部模型(JAX框架支持) [18] * **市场竞争与合作动态** * **Google TPU v7的“反击”**:2025年11月发布的TPU v7(Ironwood)单pod聚合计算能力据称是NVIDIA最大NVL72机架配置的约40倍 [20];市场策略从自用转向对外销售,目标抢占NVIDIA数据中心收入份额的10%,潜在客户包括Meta(数十亿美元交易)、Anthropic(超100万颗TPU芯片)等 [22][24][257] * **NVIDIA与Groq的强强联合**:合作价值高达200亿美元,旨在补全NVIDIA在推理市场的短板,通过整合LPU技术提供端到端解决方案 [22][23][274][282] * **未来技术趋势** * **专用化**:ASIC芯片市场份额预计到2026年将达到30%以上 [25];TPU专注于大规模矩阵运算,LPU专注于实时推理优化,边缘AI专用芯片兴起 [25][27] * **高能效**:“绿色AI”成为关键指标,性能功耗比优先,依赖先进制程工艺(3nm, 2nm)、创新架构及液冷散热技术 [25][27] * **异构计算**:多芯片协同工作成为主流架构,例如GPU负责训练、TPU负责大规模推理、LPU负责实时交互 [25][27] * **未来市场格局** * **云计算巨头自研芯片**:现有布局包括Google的TPU v7、Amazon的Trainium和Inferentia、Microsoft的Maia、Apple的Neural Engine [32];预计到2026年,自研芯片性能将与NVIDIA正面竞争,并与云服务深度绑定,提供一站式解决方案以减少对第三方供应商依赖 [28][32] * **初创公司机遇与挑战**:机遇在于边缘AI市场增长、低功耗推理需求及细分领域创新 [33];挑战在于高昂的研发成本、巨头生态竞争压力及供应链地缘政治影响 [29][33] * **未来应用前景** * **大模型推理普及化**:到2026年,LLM推理成本将大幅下降,应用更加普及 [31] * **边缘AI兴起**:LPU、NPU等低功耗芯片将在物联网设备端发挥重要作用 [31] * **行业渗透与融合**:AI芯片将深入制造业(智能质检)、金融业(智能风控)、医疗健康(影像诊断)、自动驾驶(高级别功能)、教育(个性化学习)、智能客服等领域 [31][34][35][36] 其他重要内容 * **资本博弈**:AI芯片市场的竞争不仅是技术比拼,更是技术、资本和生态的全方位较量 [37] * **发展主线**:AI芯片的发展史是技术创新与市场需求相互促进的演进史,从GPU的并行计算革命,到TPU的专用架构创新,再到LPU的确定性执行突破 [37]
沐曦/摩尔线程/壁仞科技IPO狂欢背后的冷思考:2026年一场"隐形风暴"已至
36氪· 2025-12-19 17:30
文章核心观点 - 中国半导体行业近期在云端算力(GPU)领域迎来高光时刻,以沐曦股份、摩尔线程等公司上市为标志,反映了市场对算力自主和国产替代的热情 [1] - 行业价值重心正从“集中算力”向“无处不在的智能”迁移,物联网半导体行业即将迎来深刻变化,2026年将是关键的变革年份 [1][3][4][5] - 真正的增量市场在于数量级更庞大的物联网终端与边缘设备,而非仅限于GPU和服务器 [4] 行业背景与驱动因素 - 大模型、AI应用的快速落地使算力成为“基础设施级资源”,外部环境不确定性使“自主可控”和“供应链安全”成为刚性需求,资本因此重新评估中国芯片产业的长期价值 [2] - AI技术成熟和成本下降推动算力从数据中心向边缘和终端扩散,智能汽车、工业设备、可穿戴设备等场景更倾向于本地完成判断和决策 [3] 2026年物联网半导体行业六大预测 拐点一:边缘AI集成进程显著提速 - 2026年将开启搭载边缘AI加速功能的物联网设备大规模应用的首轮浪潮 [7] - 技术下沉:新型IoT SoC设计将引入轻量级NPU、矢量扩展指令集及类DSP的AI核心,不再是高端设备专属 [8] - 场景爆发:支持AI的芯片组将广泛渗透至传感器、IoT连接模组、工业PC及中端网关 [9] - 工具配套:市场对“AI-ready”的EDA工具和可复用IP(如低功耗NPU)的需求将全面爆发 [9] 拐点二:Chiplet与RISC-V份额激增 - 模块化设计(Chiplet)与开放架构(RISC-V)将在2026年迎来显著增长 [10] - Chiplet(芯粒):将计算、存储和I/O功能解耦为更小的裸片,利用不同工艺节点生产,2026年该模式将从高端服务器下沉到IoT、汽车及AI芯片组中,显著降低一次性工程费用(NRE) [11] - RISC-V:其开放、模块化的指令集架构允许企业构建差异化处理器,预计2026年将在低功耗IoT边缘设备、边缘AI处理器及汽车子系统中进一步普及 [11] 拐点三:碳足迹成为设计“硬指标” - 碳追踪正日益被视为物联网的核心设计约束,与功耗、性能、面积和成本(PPAC)并列 [12] - 法规倒逼:欧盟《企业可持续发展报告指令》(CSRD)等法规落地,使碳透明度成为必然 [13] - 工具升级:2026年,EDA工具和IP供应商将把排放数据纳入PPAC的早期评估体系 [14] - 采购变革:OEM采购团队将开始横向对比芯片的“隐含碳”数据,“碳意识选型”将成为常态 [15] 拐点四:生产本地化 - 到2026年,更多物联网芯片将在区域生态系统内完成制造、封装和组装 [16] - 政策驱动:美、欧、中、日等国政府通过巨额补贴(如美国《芯片与科学法案》、中国“大基金”)推动半导体生产本地化 [17] - 产能释放:许多专注于物联网相关工艺(如成熟节点逻辑、模拟、嵌入式存储器)的新建晶圆厂将在2026年投产,旨在降低地缘政治风险并保障供应链安全与韧性 [17] 拐点五:AI Design AI——工程师的“硅基副驾驶” - 2026年,AI将不仅仅是辅助工具,而是开始作为工作流的“副驾驶”(Copilots) [18] - 全流程渗透:AI辅助验证、约束检查及布局优化将在物联网设计团队中得到广泛应用 [19] - 代理式AI(Agentic AI):行业正从简单的代码生成向“自主设计代理”演进,这些代理将协调现有的EDA工具,自动化执行常规步骤 [19] 拐点六:安全设计成为“入场券” - 安全设计已从“最佳实践”转变为监管层面的“期望” [20] - 合规强制:《欧盟网络弹性法案》等法规要求设备在上市前必须具备可验证的硬件防护,硬件信任根、安全启动将在2026年成为高端IoT MCU的标配 [21] - 后量子密码学(PQC):为应对未来量子威胁,NIST指导2035年前完成PQC迁移,受此驱动,2026年能源、车联网等长生命周期领域将出现内置PQC就绪安全模块的芯片试点 [21] 对不同市场参与者的建议 对于芯片设计公司 - 停止参数内卷,转向场景差异化,评估IP库中是否有轻量级NPU储备 [24] - 拥抱新架构:认真考虑RISC-V与Chiplet技术,这可能是打破巨头垄断、降低流片成本的机会 [25] - 建立碳数据模型:将碳足迹数据模型作为产品的差异化卖点 [26] 对于设备制造商(OEM) - 拒绝“假智能”:不再把“智能”完全寄托于云端,寻找支持端侧推理的SoC供应商是当务之急 [27] - 安全左移(Shift Left):在产品定义阶段就引入安全合规审查(如SBOM管理),硬件级安全是进入欧洲或汽车市场的必答题 [28] 对于产业投资人 - 寻找“卖铲人”:关注能提供AI EDA插件、安全合规自动化工具以及Chiplet互联接口IP的企业 [29] 行业长期展望 - 价值重构:芯片的价值将从“单一的算力峰值”转向“单位能耗下的智能密度”和“全生命周期的安全合规” [31] - 生态重组:随着制造本地化和RISC-V的崛起,全球半导体供应链将从“单极主导”走向“多极共生”,区域性的芯片生态系统将变得更加重要 [32]
德银深度研究:2026年科技硬件行业七大核心主题与投资机会
智通财经· 2025-12-11 22:19
文章核心观点 2026年科技硬件行业(涵盖半导体、电信设备、IT硬件)依然是投资大年,行业将围绕七大核心主题展开,包括严重内存短缺推动半导体设备重估、AI投入挤占非AI组件供应、光学领域在AI数据中心发力、测试领域持续升温、氮化镓应用前景乐观、边缘AI取得适度进展以及中国半导体本土化进程出现实质性转折 [1] 严重内存短缺推动半导体设备标的重估 - DRAM现货价格在过去三个月飙升300%-400%,达到原来的4-5倍,具体型号DDR4现货价格为每GB 17美元,DDR5为每GB 13-14美元 [2] - 合约价格涨幅相对温和,Trendforce预测2025年第四季度PC DRAM合约价格环比上涨25%-30%,服务器DRAM环比上涨43%-48% [2] - 多数机构预计随着分销商库存耗尽,2026年上半年内存价格将至少再上涨30%-50% [2] - NAND闪存现货价格过去三个月上涨200%,11月晶圆级NAND合约价格环比上涨20%-60%,基准512Gb TLC合约价格环比涨幅超65%,预计2026年第一季度价格将继续实现两位数涨幅 [2] - 内存短缺可能持续至2027年,有望推动2027/2028年晶圆厂设备支出预期显著上调 [3] - 半导体设备标的如ASML,其2027年预期市盈率当前为25-30倍,未来有望突破至35倍,其当前相对其他五大半导体设备巨头的估值溢价处于10年区间底部,仅约20% [3] - 2027-2028年DRAM晶圆厂设备支出大幅增长的最敏感标的是ASML、VAT集团与SUSS MicroTec,若NAND闪存设备支出复苏则对Comet尤为有利 [4] AI投入挤占非AI领域组件供应 - 内存、被动元件及光学组件可能面临供应挑战,将在2026年对主流电子产品生产产生连锁影响,硬盘驱动器等领域也存在短缺问题 [4] - 最可能受负面影响的品类包括消费电子、智能手机、个人电脑及汽车电子产品 [4] - 供应链中最脆弱的环节是智能手机、消费电子、PC领域的中低端原始设备制造商,这些厂商议价能力较弱且依赖分销渠道 [4] - 内存成本上涨可能迫使中低端原始设备制造商要求无晶圆厂企业提供更大幅度的价格让步,短期内最可能出现的结果是厂商转向更低内存配置,或产品发布直接延迟 [4] - 汽车电子领域受到的相对影响较小,因为供应商通常会为汽车级产品维持独立的生产线以满足可靠性规格 [5] 光学领域在AI数据中心持续发力 - AI数据中心投入推动带宽需求飙升,数据中心内部及之间的流量呈爆炸式增长 [5] - 数据中心正逐步向更高速度的可插拔光学器件、线性可插拔光学器件演进,未来将实现数据中心内部的共封装光学器件,并搭配更广泛的相干链路 [5] - 线性可插拔光学器件采用线性驱动器替代完整的数字信号处理器,可降低功耗与延迟 [5] - 在共封装光学架构下,光学引擎紧邻交换机/xPU,这一设计更有利于硅光子集成芯片,光学组件的含量将大幅提升 [5] 测试领域持续升温 - 测试领域正经历由芯片复杂度提升与失效成本上升驱动的结构性转型,作为英伟达核心探针卡供应商的Technoprobe市场份额约100% [6] - 随着AI加速器封装成本日益高昂且每个封装集成的芯粒数量增加,报废成本呈指数级增长,这为测试预算提供了结构性支撑 [6] - 台积电计划在2022-2026年期间将其“AI测试产能”以80%的复合年增长率扩张,同时外包半导体封测厂商也计划在2026年大幅扩充产能以缓解产能瓶颈 [6] - 先进封装领域,台积电与外包半导体封测厂商持续投入2.5D CoWoS产能扩张,行业对从2.5D向3D封装转型的需求强烈 [6] - 2026年苹果将首次采用台积电的3D封装方案应用于高端笔记本电脑,可能实现CPU与GPU模块的分离设计 [6] - 2026-2027年期间更大的市场机遇来自DRAM领域:HBM4E与HBM5有望从热压键合转向无焊剂热压键合或晶圆对晶圆混合键合工艺,以实现16层及以上堆叠 [7] - 随着英特尔推出背侧供电技术,晶圆对晶圆混合键合趋势将进一步加速 [7] 氮化镓乐观预期 - 英伟达推动AI数据中心向800V架构转型是一项重大举措,需要供应链各方协同努力,涉及电网接口设备、功率半导体、磁性元件、冷却系统和机架结构等多个领域 [8] - 当前48V架构存在电流过大问题,导致严重的功率损耗和铜缆使用量过高,向800V架构转型势在必行 [8] - 英伟达对AI数据中心的推动正为氮化镓创造发展动力,堪比碳化硅在特斯拉身上的应用时刻 [8] - AI处理器功耗预计将从2023年的7GW增长至2030年的70GW以上,增长10倍 [9] - 向800V架构转型使工作电压提升15倍,将提高能效,同时使机架功率达到1MW或更高 [9] - 每GW供电对应的功率半导体含量将达到3000-5000万美元,到2030年氮化镓和碳化硅市场规模有望达到26亿美元 [9] 边缘AI主题取得适度进展 - 边缘AI指在终端用户设备上本地进行轻量级AI处理,或卸载至本地边缘节点的模式,其核心优势包括保护隐私、降低延迟,同时具备节省数据中心投入的潜力 [9] - 多家企业表示边缘AI已进入加速增长阶段,尽管目前基数较低,例如AMD指出“边缘AI爆发”“现已开启”,但也承认边缘解决方案“仍处于应用初期阶段”和“试验阶段” [9] - 安霸表示,其定义的“边缘AI”市场将在2025年占其总收入的80%,涵盖汽车高级驾驶辅助系统、视频监控、机器人和智能城市等应用领域 [10] - 工业领域,罗克韦尔自动化近期推出了基于英伟达Nemotron Nano的解决方案,这是一款专为罗克韦尔产品工作流程优化的小型语言模型,为工业环境提供基于边缘的生成式AI能力 [10] 中国半导体本土化进程实质性转折 - 根据专家访谈反馈,中国在成熟制程半导体以及约半数晶圆厂设备支出相关领域的能力已出现明显转折 [11] - 变化体现在两个层面:一是中国原始设备制造商与集成器件制造商/晶圆代工厂面临更大的本土采购压力;二是中国本土供应商在规模与质量上满足这些客户需求的能力显著提升 [11] - 2026年可能成为关键年份,市场将更清晰地认识到西方企业在半导体及设备领域于中国市场的潜在市场规模可能面临萎缩 [11] - 中国企业此前“低端市场渗透”的叙事可能升级为“中端市场渗透”,这将迫使西方企业选择相应的应对策略,包括加大创新投入、收缩业务、战略合作或被动承受 [11][13] - 众多中国半导体企业计划在香港上市的消息进一步加剧了这一担忧,2025年6月以来韦尔股份、通富微电、圣邦股份、中芯国际和纳芯微等企业已提交招股说明书 [12][14] - 半导体领域,预计部分品类(如功率模块、碳化硅、传感器、低端微控制单元)的竞争可能过于激烈,导致部分西方企业选择退出,这些领域积累的产能大多可转向AI数据中心相关应用 [14] - 半导体设备领域,预计中国本土企业将在更多细分领域形成实质性竞争,例如ASM国际在原子层沉积设备领域将面临先导集团、中微公司和华峰测控的竞争,华海清科有望在中国晶圆对晶圆混合键合设备领域获得更多关注 [14]
内存短缺潮、光电子加速渗透、边缘AI回归......德银总结2026年六大科技硬件交易主题
华尔街见闻· 2025-12-11 15:15
文章核心观点 德银报告认为,2026年欧洲科技硬件行业将由六大主题主导:内存短缺、AI挤压主流组件、光电子加速渗透、先进封测升级、800V电源架构改革及边缘AI回归增长 这些趋势正在重构行业竞争格局 直接影响消费电子、智能手机、数据中心等关键终端市场 并为半导体设备、功率器件、光模块等细分领域带来结构性投资机会 [1] 内存短缺与价格波动 - 过去三个月,DRAM现货价格暴涨300-400%,NAND闪存同步大涨200% 涨势正向合约价快速传导 [1] - DDR4现货价达到每GB 17美元,DDR5为13-14美元 NAND闪存关键标杆产品TLC 512Gb现货价上涨200% [2] - 2025年第四季度PC DRAM合约价环比上涨25-30%,服务器DRAM环比涨幅高达43-48% 11月晶圆级NAND合约价环比涨幅介于20-60%之间 [2] - 市场预期2026年上半年DRAM和NAND合约价将再涨30-50% 短缺态势将持续至2027年 [2] - 内存短缺推动晶圆制造设备支出超预期增长 德银预测ASML等半导体设备龙头估值可能突破常规25-30倍的2027年预期市盈率区间 ASML目标价已上调15%至1150欧元 对应35倍2027年预期市盈率 [2] AI支出对主流组件的挤压 - AI支出的爆发式增长加剧了关键组件的供应紧张 对低中端智能手机、PC等主流电子领域构成持续阻力 [3] - 内存、无源器件、光组件及硬盘驱动器的供应受限 使议价能力较弱的OEM厂商陷入被动 [3] - Realme相关负责人表示 内存成本的陡峭上涨可能迫使公司在2026年6月前将手机价格提高20-30% [3] - Dell首席运营官称当前成本上涨速度史无前例 [3] - 汽车行业因拥有独立产线受冲击较小 但Nokia和Ericsson等网络设备厂商可能面临无源器件等组件的供应压力 Raspberry Pi、Soitec等对智能手机行业暴露度较高的企业将直面经营压力 [3] 光电子/光子学技术加速渗透 - AI数据中心的带宽需求爆炸式增长 推动光电子/光子学技术成为行业增长的核心引擎 [4] - 技术将从当前的可插拔光模块 逐步向高速可插拔光模块、线性可插拔光学及共封装光学演进 以实现更低功耗和延迟 [4] - LPO通过线性驱动器替代完整DSP 显著降低功耗与延迟 CPO则将光引擎紧邻交换机/xPU部署 大幅提升能效 这两种技术均推动硅光子学的渗透率快速提升 [4] - Tower Semi计划在2025年底将硅光子产能翻倍 并在2026年中再扩大三倍 目标2026年硅光子销售额达到9亿美元 较2024年的1.05亿美元实现跨越式增长 [4] - Nokia通过Elenion交易获得自有SiPho平台 正在圣何塞扩建光子芯片工厂 产能将提升25倍 其AI数据中心相关订单年初至今已增长3倍 Soitec的SOI晶圆在低插入损耗单模波导领域占据主导地位 [4] 测试与先进封测升级 - AI加速器复杂度提升与产品价值增长 推动测试与先进封测成为半导体产业链的关键增长点 [7] - 随着AI加速器封装集成的芯粒数量增加 产品报废成本呈指数级上升 促使企业大幅增加测试预算 英伟达等客户正积极扩大测试覆盖范围 [7] - 台积电计划在2022-2026年间将AI测试产能以80%的复合年增长率扩张 OSATs也在2026年积极扩产以缓解产能约束 [7] - 先进封测领域 2.5D CoWoS产能持续紧张 行业正向3D封装积极迁移 苹果计划2026年在高端笔记本电脑中首次采用台积电的3D封装方案SolC-mH [7] - 2026-2027年HBM4E和HBM5有望从TCB工艺转向无焊剂TCB或D2W混合键合工艺 以支持16层及以上堆叠 Intel的PowerVia背侧供电技术则将推动W2W混合键合趋势加速 [7] - Technoprobe凭借在探针卡领域的优势直接受益于测试需求增长 Besi则在混合键合领域与台积电深度合作 有望在高堆叠HBM量产中获得更大市场份额 [7] 800V电源架构转型 - 英伟达推动AI数据中心从48V向800V电源架构转型 成为功率半导体领域的重要变革 氮化镓作为核心器件迎来发展机遇 [8] - 当前48V架构在高功率传输中存在严重功率损耗和铜缆成本问题 800V架构通过高压低电流传输 可显著提升效率并降低铜缆使用量 [8] - 转型涉及电网接口、机架级DC/DC转换和板级电源三个关键阶段 电网接口需升级为固态变压器 采用SiC开关和高频磁元件 机架级转换依赖高压GaN、SiC等器件 板级电源则面临传统横向VRM与垂直/共封装电源的技术路线竞争 [8] - 谷歌已在TPU中部署垂直电源 能耗较GPU降低60-65% [8] - AI处理器功耗预计将从2023年的7GW增长至2030年的70GW 为GaN和SiC创造巨大市场空间 Infineon预计到2030年其AI电源可寻址市场规模将达到80-120亿欧元 [8] - 德银警告 Aixtron股价自2025年11月3日以来已上涨28% 当前市场对GaN的乐观预期可能已过度 若800V架构部署延迟 相关企业将面临估值回调风险 Infineon凭借率先实现300mm GaN量产的优势 市场份额有望持续提升 [9] 边缘AI回归增长 - 边缘AI历经多年蛰伏后 2026年将迎来适度增长态势 成为科技硬件行业不可忽视的新增长点 [10] - 边缘AI是指在终端设备或本地边缘节点开展轻量化AI处理 其核心优势在于保障数据隐私、降低传输延迟 同时大幅节省数据中心建设与运营成本 [10] - 汽车ADAS系统、视频安防设备、工业控制终端成为核心应用场景 Rockwell近期推出基于英伟达Nemotron Nano的专用小型语言模型 为工业环境提供边缘生成式AI能力 Ambarella透露 其涉及设备端AI处理的边缘AI业务 2025年已占公司营收的80% [10] - 消费电子、可穿戴设备、智能家居等领域成为潜在增长极 合计占据边缘AI设备市场约70%的机会空间 [10] - SHDGroup预测 到2030年边缘AI设备收入将达到1030亿美元 2025-2030年复合年增长率高达21% CEVA预计 其物理AI与边缘AI的可寻址市场规模到2030年将突破1700亿美元 [11] - 轻量化蒸馏模型的迭代为行业增长提供关键支撑 HuggingFace榜单显示 Microsoft Phi-3.5-mini-Instruct、DeepSeek-R1-Distil-Owen-1.5B等参数小于30亿的模型已具备较强实用性 推动边缘AI在低算力设备上的普及 [11]