Nvidia's $20 Billion Groq Acquisition Just Paid Off. This New Chip Could Change the AI Inference Game in 2026.
英伟达收购与产品发布 - 2025年底,英伟达以200亿美元现金收购芯片初创公司Groq的人工智能推理部门[1] - 收购后不到三个月,英伟达首席执行官黄仁勋发布了Groq 3 LPX推理加速器,将Groq的低延迟处理器整合至英伟达AI工厂架构的计划已成为现实[2] - 新产品旨在结合LPU的交互性与Rubin平台的吞吐量和性能,为基于语言的推理模型提供更优的智能体AI系统[8] 人工智能推理芯片的重要性 - 人工智能推理指训练好的AI模型根据新数据或输入做出决策,是AI模型完成几乎所有“工作”的核心环节[6] - 推理通常包含预填充和解码两个步骤,预填充是模型处理查询,解码是模型根据累积的训练数据生成响应[7] - “推理芯片”是专门为经济高效地加速AI推理任务而优化的处理器和内存芯片[7] Groq 3 LPX的技术特点与行业影响 - Groq专注于语言处理单元技术,其LPU能以低延迟解析和排序自然语言输入输出[8] - Groq 3 LPU使用静态随机存取内存来增强AI模型的交互性,其内存带宽高达每秒150 TB[8] - 相比之下,英伟达顶级的Rubin GPU虽拥有288GB内存,远超LPU的500 MB,但其内存带宽仅为每秒22 TB[8] - 新产品结合了LPU的高交互性与Rubin平台的高吞吐量,有望在2026年改变AI推理领域的竞争格局[3][8]