Workflow
非GPU架构
icon
搜索文档
英伟达1400亿“收购”,GPU拐点已现?
半导体行业观察· 2025-12-27 09:33
文章核心观点 - 英伟达以200亿美元现金收购Groq公司的技术授权,是其史上最大规模投资,旨在获取并整合被称为“高阶TPU”的可重构数据流架构(LPU),以应对AI推理市场日益增长的需求和非GPU架构的竞争压力 [1][3][17] - 以Groq LPU和谷歌TPU为代表的非GPU架构(包括ASIC和可重构数据流芯片)在AI推理环节展现出显著优势,包括更高的速度、能效比和更低的成本,正在动摇英伟达GPU在AI算力市场的绝对主导地位 [4][13][15] - AI算力芯片市场正从以训练为中心转向推理为重,技术路线呈现GPU与非GPU(ASIC/可重构数据流)两大流派并存的格局,非GPU架构的市场份额预计将显著提升 [4][18] 交易概述与战略意义 - 交易规模达200亿美元(约1400亿元人民币),相当于英伟达606亿美元现金及短期持有资本的三分之一,超出Groq此前估值的3倍 [1][17] - 交易性质为“非排他性授权协议”,英伟达获得Groq的知识产权许可并吸纳其核心团队(包括谷歌TPU缔造者Jonathan Ross),但未收购公司实体 [1][14] - 此次收购是英伟达为补齐非GPU赛道短板、巩固算力领域主导地位的关键布局,旨在将Groq的低延迟处理器整合到其AI工厂架构中,服务更广泛的AI推理和实时工作负载 [14][17] 非GPU架构技术优势(以Groq LPU为例) - **架构创新**:采用软件定义硬件的可重构数据流架构(LPU),消除内存带宽瓶颈,实现确定性执行和零延迟,被业界誉为“高阶TPU” [2][6] - **性能表现**:在处理大语言模型时,能实现每秒数百个Token的“瞬时”吐字;基于14nm工艺,无需外部HBM,通过动态调度让数百个核心同步工作,可实现40倍于传统方案的推理性能 [2][6] - **能效与成本**:能效比英伟达GPU最高可提升10倍;制造晶圆成本可能低于每片6000美元,远低于采用5nm工艺、成本近每片16000美元的英伟达H100芯片 [9][11] - **实际案例**:Groq的AI云算力系统在72小时内将月之暗面开源模型Kimi K2的性能提升40倍;运行开源模型Mixtral 8x7b时,吞吐量最高可达其他推理服务的4倍,价格却不到Mistral本身的三分之一 [7][11] 市场竞争格局变化 - **谷歌TPU的竞争**:谷歌第七代TPU Ironwood单芯片FP8稠密算力达4.6 petaFLOPS,略高于英伟达B200的4.5 petaFLOPS;一个集成9216颗芯片的Ironwood Pod,FP8峰值性能超42.5 exaFLOPS,在特定负载下性能相当于最接近竞品系统的118倍 [16] - **客户动向**:英伟达大客户Meta正考虑在其数据中心大规模采用谷歌TPU,此消息曾导致英伟达股价单日一度暴跌6%,市值蒸发数千亿美元 [15] - **市场份额预测**:花旗预测英伟达AI芯片市场份额将从90%逐步下滑至2028年的81% [16] - **其他玩家**:英特尔正就收购另一家可重构芯片设计公司SambaNova进行初步谈判,该公司估值达50亿美元 [18] 市场前景与数据预测 - **全球市场**:IDC预计2025年AI算力芯片市场规模将超过1285亿美元,同比增长47.1%;到2030年市场规模将达4138亿美元,其中非GPU架构芯片市场规模占比将超过21%,推理芯片占比将提升至65% [18] - **中国市场**:2024年中国加速服务器市场规模达221亿美元,同比增长134%,其中非GPU加速服务器占比已超过30%;IDC预测到2029年,中国非GPU服务器市场规模占比将接近50% [21]