Workflow
半导体行业观察
icon
搜索文档
AI存储,再度爆火
半导体行业观察· 2025-10-02 09:18
文章核心观点 - AI的飞速发展使存储成为与算力同等重要的关键环节,HBM、HBF和GDDR7三种存储技术正在重新定义AI基础设施的未来格局 [1] - 这三种技术的竞合演进关乎存储产业数千亿美元的市场格局,并决定着人工智能能否突破当前技术天花板,迈向通用人工智能新纪元 [1] - 没有一种存储技术能够包打天下,HBM、HBF、GDDR7在特定领域发挥着不可替代的作用,反映出AI产业对存储需求的多样化和精细化 [23] HBM(高带宽内存)技术发展 - HBM通过3D堆叠技术实现超高带宽存储,已成为决定AI芯片性能上限的关键因素,从H100的80GB容量、3.4TB/s带宽提升到GB300的288GB容量、8.0TB/s带宽,不到三年实现容量超两倍、带宽约2.5倍的提升 [3] - SK海力士凭借技术和市场双重优势稳居霸主地位,已进入HBM4最终测试阶段并向英伟达供应样品,同时宣布完成下一代HBM4内存开发并具备全球首个大规模量产条件 [3] - 三星电子在HBM4性能方面有信心,采用4纳米代工工艺应用于逻辑芯片,但测试进度落后竞争对手约两个月,在快速迭代的AI市场中可能造成致命影响 [3] - HBM正向定制化(cHBM)发展,SK海力士已锁定英伟达、微软、博通等重量级客户开展定制设计,从第七代HBM(HBM4E)开始将全面转向定制化路线 [4] - 定制化HBM的核心在于将基础芯片功能集成进由SoC团队设计的逻辑芯片中,赋予设计人员更大灵活性,可更紧密集成内存与处理器芯片,并根据具体应用优化功耗、性能与面积 [4] - 三星电子发起“背水一战”,在董事长李在镕支持下为HBM业务投入全部精力,正量产HBM4样品,产量约为10,000片晶圆,采用尚未完全成熟的10nm级第六代(1c)DRAM技术 [5][6] - 三星采用激进定价策略,业内估计12层HBM4价格将比HBM3E高出60-70%,但三星正考虑低于20%的溢价,同时加速建设平泽第五工厂配备10纳米第六代DRAM生产线,专门用于批量生产HBM4 [6] HBF(高带宽闪存)技术前景 - HBF是将NAND闪存层叠而成的产品,利用NAND闪存特性实现更大存储容量,试图在带宽与容量之间找到新平衡点,满足AI基础设施对存储需求的指数级增长 [8] - 美国闪存企业Sandisk今年2月宣布正在开发HBF技术,将其定位为“结合3D NAND容量和HBM带宽”的创新产品,能够同时满足带宽、容量、低功耗的综合要求 [8] - HBF技术路线的提出源于AI模型向多模态、长上下文方向发展,需要处理海量中间状态数据,传统DRAM容量扩展成本高,NAND闪存访问速度慢,HBF试图通过架构创新找到最优解 [8] - Sandisk与SK海力士签订开发HBF的谅解备忘录,计划明年下半年向客户提供样本,2027年初为推理AI提供正式产品,此消息推动Sandisk股价从43美元飙升至86美元,翻了一番 [9] - HBF技术实现面临挑战,NAND闪存访问速度远低于DRAM,若CPU将基于NAND的存储当作主存使用,运算速度必然大幅下降,需要能够一次性处理和传输大规模信息的软件和基础设施支持 [9][10] - HBF和HBM并非竞争关系而是互补,HBF更适合需要超大容量的特定应用场景,如视频生成模型Sora需要处理数TB中间数据,HBF通过牺牲部分带宽换取更大容量满足这类需求 [10] - HBF在成本控制方面具有潜在优势,NAND闪存每GB成本远低于DRAM,在需要大容量但对带宽要求相对宽松的应用场景中具有明显经济性 [11] GDDR7技术应用与市场 - 英伟达推出Rubin CPX GPU采用128GB GDDR7显存而非更高端HBM4,体现对AI推理架构的新思考,提出“解耦推理”理念将推理过程拆分为上下文阶段和生成阶段 [13] - 在该架构下,Rubin CPX承担上下文构建任务,GDDR7带宽和延迟已完全足够,生成阶段工作交由配备HBM4的标准Rubin GPU执行,避免资源浪费并优化成本 [13] - HBM在加速器BOM中已成为最昂贵单一组件,从Hopper到Blackwell成本占比不断攀升,合理配置不同类型存储成为优化成本的关键 [13] - 英伟达为RTX Pro 6000下达大量GDDR7订单主要由三星承接,近期要求三星将GDDR7产量翻倍,三星扩大生产设施并增加材料与组件,预计本月启动扩产后的供应链 [14] - 英伟达准备推出代号“B40”新产品搭载三星GDDR7针对中国市场销售,通过降低数据处理能力规避出口限制,预计今年出货量可能达到100万片,仅GDDR7基板需求就高达约2000亿韩元 [14] - GDDR7的采用是成本优化选择,可能成为AI推理普及化的重要推手,通过大幅降低显存在系统总成本中的比重,使更多企业能够负担AI推理基础设施 [15] - 当token成本显著下降,用户对推理需求会激增,需求增长往往远远抵消成本下降影响,推动整个市场规模持续扩大,整体市场对高端HBM需求可能因应用普及而进一步增长 [15] 行业活动信息 - 2025年湾区半导体产业生态博览会(湾芯展)将于10月15—17日在深圳会展中心举办,展会规模扩容50%,展示面积突破60,000平方米,汇聚600+全球头部企业,预计吸引60,000名专业观众 [17] - 湾芯展将重点展示HBM、HBF、GDDR7等前沿存储技术及其在AI算力中心、智能汽车、超算平台中的应用突破,国内外存储巨头与创新企业将带来最新产品与解决方案 [18] - 展会首创“项目采购展”模式和全年服务体系,贯穿展前精准匹配、展中高效对接、展后持续跟进,推动百亿级产业合作落地,助力中国半导体实现从“跟跑”到“领跑”的跨越 [18]
一颗芯片,叫板英伟达
半导体行业观察· 2025-10-02 09:18
公司概况与战略定位 - 韩国芯片初创公司FuriosaAI由前三星和AMD工程师June Paik于2017年在首尔创立,专注于开发用于深度学习工作负载的专用芯片[2] - 公司预见到专用AI芯片市场的兴起,并于2021年推出第一代14纳米神经处理单元,在MLPerf基准测试中表现良好并获得客户如Kakao的采用[2] - 公司正致力于通过其独特的张量收缩处理器架构来提升AI性能优势,与Nvidia等竞争对手展开竞争[2] - 公司于2024年7月底完成1.25亿美元的C轮过桥融资,使总融资额达到2.46亿美元,并决定独立发展而非被Meta收购[8] 第二代产品RNGD的技术规格 - 针对生成式AI和大型语言模型开发的第二代芯片RNGD由台积电采用5纳米工艺制造,目前正向客户提供样品[3] - 每张RNGD卡配备48GB HBM3显存,提供每秒1.5 TB的显存带宽和512 TFLOPS的FP8性能,功耗最高仅为180瓦[3] - RNGD卡兼具性能、能效和可编程性三重优势,据称在运行大型语言模型时,每瓦性能比Nvidia H100高出三倍[3][5] - 基于RNGD卡的NXT RNGD服务器系统配备八张卡,总计384 GB HBM3内存、每秒12 TB内存带宽,在3 kW热设计功率下提供4 petaFLOPS的FP8性能[4] 核心技术架构创新 - 张量收缩处理器架构的关键创新在于提高抽象层,以张量收缩作为基本基元,而非依赖GPU的低级二维矩阵乘法运算[6] - 该架构通过电路交换提取网络实现灵活高吞吐量的数据访问,促进跨计算单元的数据重用,从而最大限度地减少外部内存传输[7] - 核心技术优势在于最大限度地减少数据移动,因为在DRAM和芯片处理元件间传输数据的能耗比执行计算本身多高达10,000倍[6] - 架构与编译器和软件堆栈共同设计,提供从零开始开发的完整软件生态,包括PyTorch原生即时编译器支持和与OpenAI兼容的API[7] 市场应用与客户反馈 - 公司的每瓦性能优势已获得客户采用,LG AI Research测试表明RNGD能在每个机架上提供约3.5倍的tokens,相比GPU解决方案[7] - 低功耗技术使客户可在标准15kW以下功率限制的机架中安装更强大计算能力,每个机架的tokens数量增加约3.5倍,降低总体拥有成本[8] - OpenAI团队在首尔办公室启用仪式上展示了在RNGD加速器上实时运行的gpt-oss 120B模型,标志着其模型首次在韩国芯片上运行[8] - 公司目前专注于与全球少数重要战略客户达成最终设计协议,并加大RNGD量产力度,计划在2026年初扩大全球客户参与度[9] 人才发展与未来规划 - 公司加强了人才招聘,聘请韩国科学技术院并行系统专家Jeehoon Kang担任首席研究官,领导编译器和软件研究[9] - 聘请前三星副总裁Youngjin Cho担任硬件副总裁,负责加速芯片开发,增强公司的芯片设计能力[9] - 公司正在加大RNGD的量产力度,为2026年初的全球扩张做准备,同时专注于与战略客户达成设计协议而非优先考虑产量[9]
HBM被抢疯了
半导体行业观察· 2025-10-02 09:18
存储价格动态 - 通用DRAM(DDR4 8Gb)平均现货价格在9月达到5.868美元,创年内新高,较第一季度1美元的低位上涨近五倍 [2] - 主流内存半导体DDR5 16Gb平均现货价格达到6.927美元,较年初的4.70美元上涨40%以上,正迅速逼近2018年半导体热潮期的价格水平(7.19-8.19美元) [2] - 机构预测今年第四季度多类DRAM产品将继续涨价 [2] OpenAI的“星际之门”项目与存储需求 - OpenAI与三星电子和SK海力士达成合作,作为其5000亿美元“星际之门”项目的一部分,该项目旨在到本世纪末构建下一代人工智能基础设施 [4] - OpenAI首席执行官Sam Altman要求三星和SK海力士每月供应90万片DRAM晶圆 [5] - 每月90万片晶圆的需求量相当于SK海力士所有季度的HBM销量,接近三星电子(月产能60-65万片)和SK海力士(月产能约50万片)的DRAM产能总和 [6] HBM(高带宽内存)的重要性与市场前景 - HBM因其带宽高于传统DRAM,在AI数据中心处理海量数据时至关重要 [4] - 从NVIDIA GPU的迭代可见,HBM容量是性能升级的关键因素,例如从H100到H200、B200到B300,HBM容量均提升50% [14] - SK海力士预测HBM行业在2024年至2028年期间的复合年增长率将达到50% [18] - SK海力士2025年的HBM供应已售罄,2026年的大部分产能也已售罄;美光同样表示其2025年HBM产能已卖光 [19] AI推动存储市场进入“超级周期” - 野村预计,在AI服务器投资推动下,2026年DDR4/DDR5内存需求将增长约50%,企业级SSD需求预计将增加近一倍 [20] - DRAM营业利润率预计将从目前的40-50%攀升至2026年的近70%,接近2017年超级周期峰值水平 [20] - 摩根士丹利预测存储器将迎来“超级周期”,因AI处理器制造商(如英伟达、AMD、博通)持续吞噬先进HBM供应 [21] - 树莓派公司首席执行官指出,由于AI应用对HBM的无限需求,内存成本比一年前高出约120% [9] HBM需求激增对传统存储市场的影响 - 主要存储供应商将先进工艺产能优先分配给利润更高的服务器DRAM和HBM,限制了PC、移动和消费芯片的产能 [23] - TrendForce预计传统DRAM价格将比上一季度上涨8%至13%,若计入HBM影响,涨幅可能达13%至18% [23] - 用于中低端智能手机的LPDDR4X内存因供应商减产而供应萎缩,第四季度价格可能上涨超过10% [24] - 图形内存(如GDDR7和GDDR6)也面临供应受限和价格上涨压力 [24]
这是史上最强的MEMS芯片?
半导体行业观察· 2025-10-02 09:18
核心技术突破 - 公司开发了一种新的微机电系统技术,其核心突破在于将MEMS器件的典型纵横比从行业平均的20:1至40:1大幅提升至100:1 [7][9] - 该技术能够在单位面积上产生比当前行业标准高出10倍的力,从而实现对微镜或其他传感器组件执行器的精确控制 [3][7] - 高纵横比通过制造深而窄的沟槽实现,沟槽越深,施加到执行器上的静电力越大,增大了传感器的运动范围 [9] 技术优势与应用 - 该技术通过提供更高水平的功率来精确控制激光雷达的激光束,使其在恶劣天气及道路颠簸环境下也能保持稳定 [3] - 使用硅基挠性件像弹簧一样精确控制反射镜,避免了标准金属弹簧的磨损问题,旨在解决振动和温度波动导致的光束错位等可靠性问题 [4] - 除了激光雷达,公司正将技术应用于人工智能数据中心,计划使用其强大的镜面密集阵列将每个网络交换机的通道数量从126个增加到441个,使每个交换机的数据路由量翻两番 [12][13] 市场前景与商业进展 - 尽管激光雷达市场预计每年将增长13.6%,但汽车行业的激光雷达应用仍因技术生命周期短而相对停滞 [4] - 公司已从汽车合作伙伴处获得超过8亿美元的意向书,并已启动为期18个月的满负荷生产验证计划,目前已完成两个月 [9] - 在数据中心领域,一家全球顶尖的AI超大规模企业已在其下一代交换机中请求使用公司的镜面技术 [13] - 公司还收到了来自国防工业、航天公司及甲烷探测团体的合作试探,显示出技术的广泛潜在应用 [13]
Altera,卷土重来?
半导体行业观察· 2025-10-02 09:18
公众号记得加星标⭐️,第一时间看推送不会错过。 来源 : 内容 编译自 morethanmoore 。 每当我们谈论计算领域时,我们都会把它想象成一条从 CPU 到 GPU,再到 FPGA,最后到 ASIC 的 线路。但如果要谈论人工智能,中间的某个环节就会变得很混乱!但我认为人们忘记的一个关键点是 FPGA 的存在。 几十年来,FPGA 一直是该行业的命脉。它们是一种可重构计算,使得其他芯片的设计和构建成为可 能。FPGA 也广泛应用于各种系统,这些系统的可重构性使其能够添加新的安全性,或在生命周期内 添加新功能。这些部件通常在环境中存在 10 到 15 年甚至更长时间,从而确保可重构硬件能够持续 升级。 在FPGA行业,最大的参与者之一就是Altera。2015/2016年,Altera被英特尔以约150亿美元收购。 如今,10年过去了,英特尔正在剥离对Altera的所有权。一家名为Silver Lake的投资基金正在收购该 公司51%的股份,而英特尔将保留49%的股份。这种地位让Altera拥有了灵活性,说起来也挺有意思 的。这意味着他们掌控着自己的命运。 但FPGA至关重要的另一个因素是工具、EDA工 ...
昂瑞微,凭啥?
半导体行业观察· 2025-10-02 09:18
文章核心观点 - 全球射频前端市场空间巨大,预计2030年全部市场将达700亿美元,但国内厂商当前销售额较低,最大厂商卓胜微销售额约40亿元人民币,远低于国际巨头,成长空间较大 [1] - 国内射频前端公司未能大幅盈利的主要原因是研发投入和设备折旧过大,且出货集中于品牌客户中低端市场,价格压力大,中高端市场仍被外资厂商垄断 [1] - 随着国产射频前端芯片在中高端市场逐渐突破,营收规模提升后可将研发费用率降至合理水平并实现盈利 [1] - 昂瑞微可借助其大客户资源、复杂模组先发优势及射频前端/蓝牙双产品线优势,在多个新兴领域拓展,提升营收规模并优化盈利水平 [11] 行业市场概况 - 全球移动设备射频前端市场2024年为154亿美元,预计2030年增长至170亿美元 [1] - 国内射频前端公司业绩出现变脸,领头羊卓胜微上市后首次亏损,唯捷创芯和慧智微扣非净利润也为负 [1] - 手机客户集中化导致需开发多款芯片支持不同需求,品牌客户中高端市场主要被Qorvo、高通和村田垄断 [1] 昂瑞微增长空间分析 5G高端模组 - 2023年昂瑞微已实现5G高端模组突破,发射模组和接收模组均在头部品牌客户实现量产 [2] - 公司可利用丰富品牌客户资源池优势,迅速将5G中高端模组推向更多客户,营收规模有较大成长空间 [2] 汽车电子 - 2025年1-8月全球新能源汽车销量达4560万辆,占同期新车销量的51.3% [3] - 电动汽车对射频前端可靠性要求更高,单位ASP售价和毛利率更好,昂瑞微已在品牌市场实现规模出货 [3] 卫星通信 - 中国已大规模商用北斗和天通卫星,相关功能在手机终端和部分国产高端电动汽车上得到支持 [4] - 昂瑞微的天通PA和北斗PA已成功打入著名手机品牌和汽车品牌 [4] - 中国大力发展低轨卫星系统如星网,预计将带来大量地面终端接收系统的射频前端市场机会 [4] 低空经济 - 低空经济是以低空飞行活动为核心的新型经济形态,主要依托1000米以下空域 [5] - 低空飞行活动离不开低空通信和射频前端芯片,无人机、eVTOL等应用出现爆发趋势 [5] 高速高功率WiFi射频前端 - 新推出的中高端手机普遍支持WiFi7功能,WiFi8预计2028年年底首批产品上市 [6] - 高性能手机或路由器需要额外WiFi FEM,每个路由器通常配置4-8个WiFi FEM [6] - AI应用场景爆发带来高速高性能WiFi需求大幅增加 [6] 6G通信 - 6G预计2030年前后商用,峰值速率达1Tbps(5G的100倍),时延低于0.1毫秒 [7] - 6G将采用更高频段通信,对射频前端设计提出更高挑战,并带来波束赋形等新技术市场机会 [7] 多协议低功耗连接 - 主流短距通信协议包括蓝牙、WiFi、ZigBee、NFC和星闪等,各有不同优势特点 [8] - Thread和Matter标准旨在解决不同品牌设备间的互联问题 [8] - 昂瑞微可基于BLE蓝牙优势拓展支持多协议连接产品,开拓更多短距连接市场 [8] 端侧AI音频蓝牙 - 基于端侧音频蓝牙的AI应用爆发,如AI眼镜、智能音箱、玩具、耳机等 [9] - 参考恒玄科技2025年上半年销售额19.38亿元,说明该市场空间很大 [9] - 昂瑞微在低功耗蓝牙BLE上有较强积累,可拓展端侧AI音频蓝牙方向 [9] 国际化 - 尽管逆全球化动作增加,中国芯片公司仍可凭借产品性能和价格竞争力拓展海外市场 [10] - 昂瑞微海外销售已取得一定进展,还有较大拓展空间 [10]
美国要硬抢台湾芯片,被抵制了
半导体行业观察· 2025-10-02 09:18
公众号记得加星标⭐️,第一时间看推送不会错过。 但郑周三表示,这个想法并未纳入最新一轮的双边谈判。目前尚不清楚台积电是否参与了美台之间的 谈判。 来源 : 内容 编译自 CNN 。 中国台湾誓言抵制华盛顿的压力,将其一半的芯片产能转移到美国,向特朗普政府发出挑战。 华盛顿越来越担心其对台湾的严重依赖,台湾芯片巨头台积电为人工智能芯片设计商 Nvidia 和苹果 等主要客户供应了全球绝大多数先进半导体。但台湾的许多人认为,其芯片制造实力是一道"硅盾"。 中国台湾副院长郑丽君周三表示,台湾"不会同意"在美国本土生产 50% 的半导体,而这些半导体对 于从电子产品和 iPhone 到训练人工智能和武器系统等所有产品都至关重要。 她在结束新一轮关税谈判从美国回国后对媒体表示:"我们的谈判团队从来没有做出过对半分芯片的 承诺,所以公众可以放心。" 美国商务部长霍华德·卢特尼克(Howard Lutnick)周末在电视采访中要求台湾将芯片生产在国内和 美国工厂之间平均分配,此举引发台湾民众担忧,给正在进行的美台贸易谈判增添了新的紧张局势。 除了台北方面的反击外,反对党官员和专家也对此提出了批评。 在 NewsNation ...
高通官宣赢了官司?Arm将上诉!
半导体行业观察· 2025-10-02 09:18
法律纠纷核心与裁决 - 高通在与Arm的法律纠纷中取得关键胜利,特拉华州联邦法院陪审团裁定其子公司Nuvia生产的中央处理器单元已根据与Arm的协议获得适当许可 [2] - 陪审团对三项指控中的两项达成裁决,但在第三项指控上陷入僵局,导致审判无效,法官拒绝了Arm提出的撤销判决或重新审判的请求 [2] - 尽管高通被判无罪,但陪审团未能就Nuvia是否违反其与Arm的许可条款达成一致,为重审或进一步谈判留下空间 [4] - 法官要求双方进行调解,高通需要其在2021年斥资14亿美元收购的Nuvia及其极具竞争力的Oryon核心 [5] 技术许可争议焦点 - 纠纷源于高通在收购Nuvia后,将基于Armv8的Oryon内核用于其骁龙X处理器,Arm声称收购后需要重新协商许可 [4] - Arm要求高通销毁相关设计,称其违反了Nuvia的许可条款,而高通反驳称其现有的架构许可协议已涵盖旗下实体设计的产品 [4] - Nuvia开发的最终设计中包含的Arm技术不到1%,主要开发人员Gerard Williams III透露了这一数据 [4] 高通的技术战略与市场影响 - 高通决定将其旗舰芯片转向Arm计算架构第九版(v9),新功能旨在提高AI性能,帮助其芯片与联发科和苹果的产品竞争 [8] - 此举可能提高Arm的收入,因为Arm对新技术收取更高费用,尽管高通拥有自己的CPU设计团队并自主设计大部分芯片 [8][9] - 凭借Oryon核心,高通可以继续在PC市场发起攻势,其产品在活跃约四分之一后占据了0.8%的市场份额 [5] - 高通的Oryon Arm兼容定制CPU与苹果基于Arm的设计以及AMD和英特尔的x86处理器具有竞争力 [5] 双方业务关系与财务影响 - Arm约10%的收入(2023年超过3亿美元)来自高通,在高通使用自主定制的Oryon内核之前,其依赖于Arm设计的Cortex内核并支付更高费用 [6] - 高通针对Arm提起的单独诉讼仍在进行中,指控Arm违反合同、不当干扰客户关系,该案庭审预计在2026年3月 [6] - 分析师指出,高通转向Arm v9架构的举动对Arm非常有利,尽管双方此前存在法律纠纷 [9][10]
俄罗斯最大芯片公司,亏惨了
半导体行业观察· 2025-10-01 08:32
公司财务状况 - 俄罗斯国有微芯片制造商Angstrem被评为2024年俄罗斯亏损最严重的公司,净亏损达2363亿卢布(28.6亿美元)[2] - 公司大部分损失源于承认对其母公司俄罗斯国家开发银行VEB的债务,价值2382亿卢布(28.8亿美元)[2] - 公司收入仅为50亿卢布(6050万美元),净亏损几乎是其营业额的47倍[2] - 法院取消了该工厂对VEB债务的担保义务,将其资产以象征性的一卢布(0.01美元)的价格转让给VEB[3] 行业比较与影响 - Angstrem的亏损超过了俄罗斯信托银行(1307亿卢布,约合15.8亿美元)、电网运营商俄罗斯国家铁路公司(1169亿卢布,约合14.1亿美元)和莫斯科地铁(1077亿卢布,约合13亿美元)[2] - 排名前十的国有企业亏损总额达6528亿卢布(79.1亿美元),占总亏损的70%[2] 公司历史与战略项目 - Angstrem的财务困境可追溯到2008年,当时工厂从VEB借款8.15亿欧元,用于生产处理器、智能卡和电子护照[2] - 该项目具有战略意义,旨在成为俄罗斯最大的芯片制造商,并得到了政府和安全委员会的支持,但工厂从未全面投入运营[3] - 到2014年,税务机关表示Angstrem实际上已失去经营能力;2019年1月,VEB扣押了工厂设备和股份并申请破产,债权总额达13亿欧元[3] 相关方后续动态 - 与前通信部长Leonid Reiman有关联的公司Rutek获得政府支持,将在莫尔多瓦共和国建造新工厂,项目耗资数十亿卢布,包括生产智能手机、电脑等进口替代计划[3] - Rutek此前的进口替代举措引发质疑,其R-Phone手机被发现是孟加拉国Symphony Helio 80的换牌产品,售价是其三倍[3]
GPU仍是王者,ASIC来势汹汹
半导体行业观察· 2025-10-01 08:32
政策环境与市场动态 - 特朗普政府宣布取消对美国企业在人工智能和机器学习领域的限制,旨在提升美国在该领域的竞争力[2] - 主要芯片制造商如Nvidia、英特尔和AMD正积极开发新的处理器以应对更高的AI性能要求[2] - 人工智能芯片市场新参与者的窗口可能不会永远敞开,预示着市场将走向成熟和整合[2] 人工智能芯片市场增长预测 - Omdia预测AI数据中心芯片市场增长已开始放缓,2022至2024年间年增长率超过250%,但2024至2025年预计增长率约为67%[4] - Precedence Research预测人工智能芯片组市场规模将从2025年的9431亿美元增长至2034年的93126亿美元,复合年增长率为28%[5] - Omdia预计AI基础设施支出在数据中心支出中的占比将在2026年达到峰值,之后到2030年逐渐减少[4] 处理器技术发展 - AMD发布Instinct MI350系列GPU,提供4倍的逐代升级方案,MI355X GPU与竞品相比每美元可产生高达40%的代币收益[9] - 英特尔发布至强6系列CPU新产品,旨在管理GPU驱动的人工智能系统,其中一款作为NVIDIA DGX B300的主机CPU[9][10] - NVIDIA发布Rubin CPX GPU,其全新平台可提供比GB300 NVL72系统高出7.5倍的AI性能,并在单个机架中提供100TB内存和每秒1.7PB的内存带宽[10][11] 市场格局与替代技术 - GPU在人工智能芯片组市场占据主导地位,主要归功于其并行处理能力,被认为是数据中心和云环境中执行训练和推理任务的理想选择[5] - GPU的替代品日益流行,包括定制ASIC芯片(如谷歌TPU)和商用ASSP(如华为Ascend系列、Groq或Cerebras)[4] - 未来增长预计将由ASIC领域推动,因其在特定AI功能中具有卓越的效率和性能,尤其适用于边缘设备和企业应用[6] 计算模式演变 - 到2024年,云端AI处理领域将占据市场52%的份额,超大规模云供应商如AWS、谷歌云和微软Azure一直在大力投资AI优化数据中心[13] - 边缘人工智能处理领域正在崛起,预计将以最快速度增长,得益于实时应用对低延迟和设备端智能的需求[13] - 对智慧城市基础设施的投资增加了交通监控和能源管理系统中的边缘部署,进一步提振了边缘计算市场[13] 行业合作与整合 - OpenAI和NVIDIA达成战略合作,将为OpenAI部署至少10千兆瓦的NVIDIA系统,NVIDIA计划向OpenAI投资高达1000亿美元[14] - NVIDIA与英特尔合作开发多代定制数据中心和PC产品,NVIDIA将以每股23.28美元的价格投资50亿美元收购英特尔普通股[15] - Jon Peddle Research预测到2030年AI处理器市场将整合至仅剩约25家供应商,物联网和边缘计算领域的供应商最有可能存活[14] 技术挑战与解决方案 - 人工智能处理器性能提升对内存配置带来挑战,面临带宽和延迟限制的问题,新兴内存设计如堆叠内存、近内存计算等技术被采用以克服瓶颈[16] - 封装技术如d-Matrix的3D堆叠数字内存计算(3DIMC)旨在通过提高数据访问速度,将AI推理工作负载的内存容量提升几个数量级[16] - 热管理受到高功率处理器影响,液冷解决方案如Flex的产品每个机架最高可处理1.8 MW功率,更高效的电力输送系统如基于800 V HVDC的架构也在开发中[17]