Workflow
LPU(语言处理单元)
icon
搜索文档
AI芯片独角兽一年估值翻番,放话“三年超英伟达”,最新融资53亿超预期
36氪· 2025-09-18 16:15
融资情况 - 公司完成7.5亿美元(约53亿人民币)融资,超出最初6亿美元预期目标[1][4] - 公司估值达到69亿美元(约490亿人民币),一年内估值从28亿美元(约199亿人民币)增长超过一倍[1][4][5][6] - 融资由Disruptive领投,贝莱德、路博迈、德国电信资本合伙公司进行重大投资,三星电子、思科系统等现有投资者参与[6] - 公司累计融资总额超过30亿美元(约213亿人民币)[6] 资金用途与业务扩张 - 融资将用于扩大数据中心容量,包括今年和明年的新选址计划[7] - 公司计划在今年宣布首个亚太地区数据中心选址[7] - 客户需求超出当前容量供给,存在未满足的高容量需求[8] 技术优势与产品特性 - 公司专注于AI推理芯片领域,自创全球首个LPU(语言处理单元)方案,硬件称为"推理引擎"[12] - 芯片推理速度较英伟达GPU提高10倍,成本降低至十分之一,测试速度达每秒478 Tokens[14] - 解决方案支持主流开源模型,包括Meta Llama系列、DeepSeek、通义千问、Mistral、谷歌Gemini及OpenAI模型[12] - 产品提供云端服务与本地部署两种模式,本地硬件采用服务器机架式集成设计[12] 团队背景与行业定位 - 创始团队包含谷歌TPU原班人马,CEO乔纳森·罗斯曾完成第一代TPU芯片20%的研发工作[9][10] - 领导层成员具备谷歌、英特尔等知名企业任职经历[9] - 公司定位为英伟达挑战者,目标三年内超越英伟达[12] 行业竞争与市场定位 - 公司致力于打破英伟达在AI芯片制造行业的垄断地位[12] - 创始人强调推理定义了AI当前时代,公司聚焦高速低成本推理基础设施构建[3]
LPU推理引擎获资金认可! 正面硬刚英伟达的Groq估值猛增 一年内几乎翻倍
智通财经· 2025-09-18 12:07
融资与估值 - 公司近期完成新一轮融资,筹集75亿美元,融资后估值约为690亿美元 [1] - 最新融资额高于7月传闻的60亿美元,估值也高于当时传闻的近600亿美元 [1] - 公司在2024年8月曾以280亿美元估值融资64亿美元,最新估值在一年内翻了两倍多 [1] - 公司今年迄今累计融资规模已超过300亿美元,堪比Anthropic等AI超级独角兽 [1] 技术与产品定位 - 公司专注于开发LPU(语言处理单元),这是一种为AI大模型推理场景定制的AI ASIC,而非通用GPU [1][2] - 产品形态包括GroqCard、GroqNode和GroqRack,被明确归类为定制推理ASIC [1] - 产品可作为云计算算力服务提供,也可作为本地部署的硬件集群提供,能运行来自Meta、DeepSeek等公司的AI模型 [2] - 公司称其LPU产品在成本显著低于核心替代方案的情况下,能保持或提升AI大模型推理运行效率 [2] 市场地位与竞争格局 - 公司被视为英伟达在AI芯片领域的最大竞争对手之一,其所在市场规模可能仅次于博通与AMD [1] - 公司致力于打破英伟达对AI算力基础设施的强势控制,后者市场份额高达90% [2] - 在可标准化的主流推理任务上,定制化AI ASIC的单位吞吐成本和能耗显著优于纯GPU方案 [7] - 当前行业实践倾向于采用“ASIC扛常态化、GPU扛探索峰值”的混合架构来最小化总拥有成本 [7] 技术优势与性能 - LPU采用TSP(张量流式处理器)核心架构,以静态、可预测的流式数据通路替代传统GPU范式,强调低延迟和稳定时延 [5] - LPU芯片采用大容量片上SRAM(约220MB)和超高片上带宽(官方示例达80TB/s),大幅减少“算存”往返 [5][6] - 在低/零批量的LLM推理场景中,LPU相比AI GPU集群能提供更低的时延、更稳定的吞吐和潜在更高的能效 [5] - 有报道称LPU在等效推理任务上的功耗约为常见GPU的三分之一 [6] 创始人背景与行业趋势 - 公司创始人Jonathan Ross曾参与开发谷歌的TPU芯片,该类芯片是谷歌为高负载AI计算设计的专用处理器 [3] - 谷歌最新披露的Ironwood TPU(TPU v6)与TPU v5p相比,峰值FLOPS性能提升10倍,功效比提升56倍 [3] - 谷歌Ironwood的42TFLOPS/瓦功效比略低于英伟达B200/300 GPU的45TFLOPS/瓦,表明专用AI ASIC正快速缩小与领先AI GPU的性能差距 [4] - 摩根大通评论认为,这一趋势正推动超大规模云计算服务商加大对象具性价比的定制化ASIC项目的投资 [4] 客户与投资者 - 公司目前为超过200万名开发者的AI应用提供算力支持,一年前这一数字仅为约35万名 [4] - 新一轮融资由投资公司Disruptive领投,资管巨头BlackRock、Neuberger Berman、Deutsche Telekom Capital Partners等参投 [4] - 三星、思科、D1和Altimeter等现有投资者也参与了本轮融资 [4][5]