文章核心观点 - 英伟达与AI芯片初创公司Groq达成一项价值约200亿美元的非排他性许可协议,实质是通过“反向收购雇佣”获取其核心团队与LPU芯片技术,以应对谷歌TPU等竞争对手在AI推理市场的挑战[1][3][4] 交易详情与结构 - 交易形式为“反向收购雇佣”,英伟达未直接收购Groq公司,而是获得了其创始人兼CEO Jonathan Ross、总裁Sunny Madra及多名核心工程师,并许可其技术[3][4] - 交易价值约200亿美元,比Groq在2025年9月的估值高出131亿美元[3] - 交易后,Groq将继续作为独立公司运营,由原CFO Simon Edwards接任CEO,其GroqCloud云服务保持正常运行[4] Groq公司背景与技术优势 - 公司由前谷歌TPU核心开发者Jonathan Ross于2016年创立,创始团队包括原TPU核心10人团队中的7位[3][7] - 核心产品为自主研发的LPU芯片,专为AI推理设计,其核心理念是“软件定义的确定性”,通过编译器精确调度,消除缓存未命中等传统架构问题[9] - LPU采用集成SRAM方案,单芯片内存带宽高达80TB/s,是传统HBM方案的20倍以上,但单芯片容量较小(约230MB)[11] - 采用RealScale互联技术,可实现数百张芯片级联协同工作,宛如一枚虚拟芯片[11] - 在处理大语言模型推理时,响应速度可达每秒500 Tokens,远高于ChatGPT的约40 Tokens/s,且延迟抖动极低[11] - 为换取极致速度,其方案在物理空间和功耗上代价较高,一个标准机架满载功耗约为26kW至30kW,且需要比GPU方案更多的机架数量[12] 市场竞争格局与英伟达的动机 - AI算力市场需求正从训练转向推理,预计到2030年,推理将占AI计算总量的75%,市场规模达2550亿美元[14] - 谷歌TPU v7在推理市场构成挑战,其实际模型算力利用率高,总体拥有成本据称比英伟达GB200系统低约30%~40%,并计划在2027年实现年产500万颗的目标[14] - 谷歌TPU已开始大规模对外出货,2025年10月Anthropic协议获取超10亿瓦谷歌算力,11月Meta洽谈于2027年在其数据中心使用谷歌TPU[14] - Groq作为竞争对手已取得市场进展:2025年2月与沙特阿美数字公司签订15亿美元协议,合作建设全球最大AI推理数据中心,初期部署19000个LPU处理器;2025年12月加入美国AI“创世纪计划”[15] - Groq于2025年9月完成7.5亿美元融资,估值达69亿美元,其平台已服务超过200万名开发者,较去年的35.6万人增长五倍多[16] 交易影响与英伟达的整合计划 - 英伟达CEO黄仁勋计划将Groq的低延迟处理器整合到英伟达AI工厂架构中,以支持更广泛的AI推理和实时工作负载[5] - 此次交易旨在帮助英伟达巩固其在面临谷歌TPU等挑战下的AI芯片霸主地位[13][18]
TPU惹急黄仁勋,200亿美元拿下「TPU之父」核心团队、技术授权