巨额「收编」Groq,英伟达意欲何为?
英伟达英伟达(US:NVDA) 雷峰网·2026-01-12 11:34

文章核心观点 - 英伟达以200亿美元收购推理芯片公司Groq,其核心战略意图是获取其创始人Jonathan Ross及其团队,以及其独创的LPU技术,旨在快速补齐公司在AI推理市场的短板,巩固并扩大其行业主导地位 [2][5][6] 重金收编的核心是什么? - 交易本质是“收购式招聘”的升级版,以技术授权名义实现“人才+技术”双收,用最小监管风险获取核心战略资产 [5] - 支付总额200亿美元中,130亿即时到账,剩余部分包含核心员工股权激励,创始人Jonathan Ross个人获得数亿美元英伟达股权,团队核心成员及芯片设计、编译器开发等核心资产尽数归入英伟达 [5] - 收购的核心人物Jonathan Ross是谷歌初代TPU核心设计者,其创立的Groq所开发的LPU芯片在LLM推理上速度比英伟达GPU快10倍,成本与功耗均仅为1/10 [6] - LPU架构采用全片上SRAM设计,片上带宽达80TB/s,是英伟达Blackwell B300的HBM带宽8TB/s的10倍,旨在消除数据搬运延迟 [6] - 此次收购是英伟达“技术补位+生态垄断”并购战略的延续,其底气来自充沛的现金流,仅2026财年Q3自由现金流就达220.89亿美元 [8] 为什么是Groq? - 全球仅谷歌和Groq两个团队掌握TPU架构技术,收购Groq补齐了英伟达在该技术路线上的短板 [10] - LPU专注于推理场景,其“顺序延迟优先”的技术路线源于Jonathan Ross的TPU开发经验,旨在解决低延迟、高能效、低成本的核心需求 [10] - 实测数据显示,Groq LPU运行Llama 3.3 70B模型时token生成速度达284 tokens/s,首token响应时间仅0.22秒,运行MoE模型时突破460 tokens/s [12] - 极致性能为Groq赢得沙特王国15亿美元的业务承诺资金 [17] - 英伟达现有H200、B300等推理芯片仍是GPU架构改良,未能突破冯·诺依曼架构局限,而谷歌TPU、AMD MI300等竞争对手均在专用推理架构上发力 [17] - 面临Meta、谷歌等大客户寻求算力多元化及Anthropic接入100万个谷歌TPU的竞争压力,收购成为英伟达抢占推理高地、留住客户的最优解 [17] - Groq代表的“去GPU化”技术路线可能颠覆产业,其可重构架构无需CUDA生态,采用GlobalFoundries和三星代工,不占用台积电稀缺的CoWoS产能,大幅降低AI芯片生产门槛 [17] 推理市场变天? - 收购后,英伟达计划将LPU作为专用DAC硬件单元嵌入CUDA生态系统,保持CUDA编程通用性,短期通过NVFusion快速集成,长期在底层架构和编译器层面实现协同设计 [19] - 不同推理场景需求各异,推理芯片架构将呈现多样化趋势 [20] - 业内人士爆料,英伟达下一代Feynman GPU或于2028年集成Groq的LPU单元,采用类似AMD X3D的独立芯片堆叠设计,利用台积电SoIC混合键合技术 [20] - 由于在先进制程上构建SRAM成本高昂,可能将LPU单元堆叠到主Feynman芯片上,利用台积电A16制程的背面供电功能确保低延迟 [21] - 在CUDA生态中集成LPU风格执行面临工程挑战,需要“工程奇迹”来确保LPU-GPU环境充分优化 [21]