Maia AI加速器
搜索文档
微软这颗芯片,撼动英伟达?
半导体行业观察· 2026-01-29 09:15
微软Maia AI加速器战略背景 - 微软是OpenAI模型的最大用户及构建GPT模型的最大计算合作伙伴,这为其打造更强大的Maia AI加速器提供了双重动力[2] - 大型云服务商及主要GenAI模型开发商(如OpenAI、Anthropic、Meta)均在开发定制AI XPU,以降低生成式AI推理的单代币成本[2] - 人工智能推理预计所需计算能力将比训练高出一个数量级,为超过一百家人工智能计算引擎初创公司创造了市场机会[2] 云服务商自研芯片的行业逻辑 - 微软等云服务商希望掌控自身硬件资源,同时保留通用x86 CPU及英伟达/AMD GPU以满足客户租用需求[3] - 云服务商通过自研计算引擎并以低于第三方产品的价格竞争,旨在减少对传统芯片供应商的依赖[3] - 类似逻辑也适用于亚马逊AWS、谷歌、百度、阿里巴巴、腾讯等自行设计CPU和XPU的公司[3] - Meta Platforms虽非严格意义上的基础设施云,但通过出租硬件运行Llama模型API,正成为面向主权国家的GenAI平台云[3] Maia 100 (Athena) 芯片设计与性能 - 芯片发布于2023年11月,设计初衷是支持AI训练和推理,并专门用于运行OpenAI的GPT模型[4] - 芯片采用台积电5纳米工艺,面积820平方毫米,晶体管数量1050亿个[12] - 计算引擎包含64个核心(推测良率下有效核心数可能为52-56个),运行频率约2.86 GHz[12] - 芯片上L1/L2缓存总容量约500MB,SRAM带宽估计为132 TB/秒[12] - 配备4组HBM2E内存,总容量64GB,带宽1.8 TB/秒[12] - 每个核心的张量单元支持微软特有的MX6(6位)和MX9(9位)数据格式[13] - 互连I/O带宽为12个400 Gb/s端口,总计4,800 Gb/s(600 GB/s)[14] - 网络设计支持构建包含576个节点、总计2304个计算引擎的集群域[19] - 芯片峰值热设计功耗(TDP)为700瓦,持续功耗为500瓦[20] Maia 200 (Braga) 芯片的升级与改进 - 芯片于2026年1月发布,专门针对AI推理任务,简化了设计[5] - 采用台积电N3P(3纳米高性能版)工艺,面积836平方毫米,晶体管数量1440亿个[21] - 核心数量增至96个,良率约92%,主流产品预计有88个可用核心[20][22] - 运行频率提升至3.10 GHz[20] - L1/L2缓存SRAM容量降至272MB,SRAM带宽降至80 TB/秒[20] - HBM内存升级为6组HBM3E,总容量216GB,带宽大幅提升至7 TB/秒[20][22] - 后端网络带宽提升至56个400 Gb/s端口,总计22.4 Tb/s(2.8 TB/s)[20][21] - 主机互连升级为PCI-Express 5.0 x16,带宽64 GB/秒[20] - 集群相干域规模扩大,支持最多1536个节点和6144个计算引擎[19][20] - 性能方面,FP4精度达10.15 petaflops,FP8精度达5.07 petaflops,BF16精度达1.27 petaflops[20][24] - 持续热设计功耗(TDP)为750瓦[20] - 张量单元仅支持FP4和FP8格式,向量单元支持BF16和FP32,不再支持Maia 100特有的MX6/MX9格式[13] Maia 200的部署与应用 - 首批Maia 200机架已部署在美国中部的Azure云区域(爱荷华州得梅因),美国西部3区域(亚利桑那州凤凰城)也将跟进[26] - 微软将使用Maia 200计算引擎为OpenAI GPT-5.2大型语言模型提供推理服务,驱动Microsoft Foundry AI平台及Office 365 Copilot[26] - 微软的AI研究人员还将使用Maia 200生成合成数据,用于训练内部模型[26] - 目前尚未有关于Azure何时会提供基于Maia 200的虚拟机实例供租用的消息[26]
Marvell股价暴跌
半导体行业观察· 2025-12-09 09:50
文章核心观点 - 华尔街对迈威尔科技(Marvell Technology)的竞争地位转趋悲观,主要担忧其可能失去亚马逊(Amazon)关键客制化芯片设计订单,导致股价下跌,但公司长期数据中心业务增长前景仍受关注 [2][3][4] 分析师评级与市场反应 - Benchmark分析师Cody Acree将迈威尔股票评级由买进下调至持有,理由是高度确信公司已失去亚马逊Trainium 3和Trainium 4设计案,相关订单可能转向台湾的世芯(Alchip) [2] - 降评导致迈威尔股价在周一(8日)下跌6.99% [2] - Acree建议投资人在公司上周公布财报后股价表现异常亮眼的情况下先行获利了结,认为市场对公司近期释放的亚马逊稳定讯号过度乐观且误判 [2] 亚马逊业务风险分析 - 亚马逊是迈威尔XPU(客制化芯片)业务的最大客户 [3] - 分析师认为,迈威尔对亚马逊年度营收增长的指引主要依赖Trainium 2的持续出货以及Kuiper低轨卫星计划,而非市场普遍认为已顺利转换到Trainium 3的设计 [3] - 亚马逊与世芯合作,是希望在即将到来的芯片专案中采取更具成本效益的设计、晶圆代工与后端支援模式 [2] - 亚马逊将为Trainium 3与4采用Synopsys的SerDes技术,这将进一步削弱迈威尔的相关业务 [3] - Trainium 2明年的出货量可能仍足以支持迈威尔的短期展望,因为客户目前仍在评估Trainium 3的气冷版本,而其液冷版本至少要到2026年中才会推出 [3] 公司长期展望与新客户潜力 - 迈威尔预期其XPU业务将在2028财年迎来重新加速,来自一位新崛起的超大规模云端客户,该项目将在后续年度逐步增量 [4] - 迈威尔首席执行官Matt Murphy表示,公司2028财年的数据中心营收可能会较前一年明显加速 [4] - TD Cowen分析师Joshua Buchalter与其他分析师认为,迈威尔的新客户可能是微软,用于该公司的Maia AI加速器 [4] - 收购Celestial AI,加上对2028年的展望,为多头提供了不少可以引用的利多论点 [4] 竞争环境与不确定性 - 《The Information》周五报导,微软正考虑由博通(Broadcom)作为可能的芯片设计合作伙伴,这进一步拖累了迈威尔周一的股价 [4] - 尽管长期展望正面,但分析师指出迈威尔在明年下半年仍有很多需要证明的地方,届时部分芯片项目将开始加速生产 [4]