Workflow
AI芯片黑马融资53亿,估值490亿
半导体行业观察·2025-09-18 10:09

融资与估值 - Groq Inc 宣布完成7.5亿美元的新一轮融资,由Disruptive领投,思科、三星电子、德国电信资本合伙公司等多家机构参与 [3] - 公司当前估值为690万美元,相比去年的28亿美元估值有显著提升 [3] 核心技术:语言处理单元 - Groq推出的语言处理单元是一款专为AI推理设计的处理器,声称在运行某些推理工作负载时,能效比显卡高10倍 [3][8] - LPU通过降低处理器组件间的协调开销,为AI模型推理释放更多处理能力,能够运行包含1万亿个参数的模型 [3] - 芯片采用确定性架构,可以单个时钟周期的粒度预测计算操作时间,有助于实现性能优化 [4] 技术优势与设计原则 - LPU使用自定义编译器,在推理工作负载启动前预先计算任务分配,减少运行时计算开销 [4] - 编译器采用改进的RealScale量化技术,仅压缩神经网络中输出质量不会显著下降的部分,以减少内存占用 [4] - 设计原则包括软件优先、可编程装配线架构、确定性计算和网络、以及片上存储器 [8] - 软件优先原则使开发人员能最大化硬件利用率,LPU专为线性代数计算设计,简化了多芯片计算范式 [9][10] - 可编程装配线架构通过数据"传送带"在功能单元间传输指令和数据,由软件完全控制,无需硬件同步,消除了瓶颈 [11][12] - 确定性计算确保每个执行步骤完全可预测,通过消除数据带宽和计算资源的争用来实现高度确定性 [13] - 片上存储器采用SRAM,内存带宽高达80 TB/秒,相比GPU片外HBM的约8 TB/秒,速度提升10倍,并减少了数据检索的延迟和能耗 [14] 产品与市场应用 - 公司将芯片作为GroqRack设备的一部分出售,该系统包含九台服务器,每台配备多个LPU,所需外部网络硬件更少,降低了成本且易于数据中心安装 [4] - 通过云平台GroqCloud提供芯片访问,开发者可通过API将LPU驱动的AI模型集成到自身软件中;新融资将用于扩展支持该平台的数据中心网络 [5] - 有报道称竞争对手推理芯片供应商Rivos正寻求以20亿美元估值融资至多5亿美元,其产品为结合显卡与CPU核心的片上系统 [6]