融资与估值 - 公司近期完成新一轮融资,筹集75亿美元,融资后估值约为690亿美元 [1] - 最新融资额高于7月传闻的60亿美元,估值也高于当时传闻的近600亿美元 [1] - 公司在2024年8月曾以280亿美元估值融资64亿美元,最新估值在一年内翻了两倍多 [1] - 公司今年迄今累计融资规模已超过300亿美元,堪比Anthropic等AI超级独角兽 [1] 技术与产品定位 - 公司专注于开发LPU(语言处理单元),这是一种为AI大模型推理场景定制的AI ASIC,而非通用GPU [1][2] - 产品形态包括GroqCard、GroqNode和GroqRack,被明确归类为定制推理ASIC [1] - 产品可作为云计算算力服务提供,也可作为本地部署的硬件集群提供,能运行来自Meta、DeepSeek等公司的AI模型 [2] - 公司称其LPU产品在成本显著低于核心替代方案的情况下,能保持或提升AI大模型推理运行效率 [2] 市场地位与竞争格局 - 公司被视为英伟达在AI芯片领域的最大竞争对手之一,其所在市场规模可能仅次于博通与AMD [1] - 公司致力于打破英伟达对AI算力基础设施的强势控制,后者市场份额高达90% [2] - 在可标准化的主流推理任务上,定制化AI ASIC的单位吞吐成本和能耗显著优于纯GPU方案 [7] - 当前行业实践倾向于采用“ASIC扛常态化、GPU扛探索峰值”的混合架构来最小化总拥有成本 [7] 技术优势与性能 - LPU采用TSP(张量流式处理器)核心架构,以静态、可预测的流式数据通路替代传统GPU范式,强调低延迟和稳定时延 [5] - LPU芯片采用大容量片上SRAM(约220MB)和超高片上带宽(官方示例达80TB/s),大幅减少“算存”往返 [5][6] - 在低/零批量的LLM推理场景中,LPU相比AI GPU集群能提供更低的时延、更稳定的吞吐和潜在更高的能效 [5] - 有报道称LPU在等效推理任务上的功耗约为常见GPU的三分之一 [6] 创始人背景与行业趋势 - 公司创始人Jonathan Ross曾参与开发谷歌的TPU芯片,该类芯片是谷歌为高负载AI计算设计的专用处理器 [3] - 谷歌最新披露的Ironwood TPU(TPU v6)与TPU v5p相比,峰值FLOPS性能提升10倍,功效比提升56倍 [3] - 谷歌Ironwood的42TFLOPS/瓦功效比略低于英伟达B200/300 GPU的45TFLOPS/瓦,表明专用AI ASIC正快速缩小与领先AI GPU的性能差距 [4] - 摩根大通评论认为,这一趋势正推动超大规模云计算服务商加大对象具性价比的定制化ASIC项目的投资 [4] 客户与投资者 - 公司目前为超过200万名开发者的AI应用提供算力支持,一年前这一数字仅为约35万名 [4] - 新一轮融资由投资公司Disruptive领投,资管巨头BlackRock、Neuberger Berman、Deutsche Telekom Capital Partners等参投 [4] - 三星、思科、D1和Altimeter等现有投资者也参与了本轮融资 [4][5]
LPU推理引擎获资金认可! 正面硬刚英伟达的Groq估值猛增 一年内几乎翻倍