Groq芯片
搜索文档
独家丨直指2000 Tokens/s,北大系「流式推理芯片」公司完成数千万元融资
雷峰网· 2026-03-09 08:35
公司融资与背景 - 国内AI推理芯片创业公司寒序科技完成数千万元融资,投资方为启高资本、赛意产业基金,源合资本担任独家财务顾问 [2] - 公司成立于2023年8月,源于北京大学磁学中心,核心团队是国内首个能跑通从物理、材料、器件到异质集成、芯片设计、算法的交叉团队 [3] 产品技术与性能 - 公司专注于超快流式推理芯片,产品定义聚焦于推理速度,核心理念为“唯快不破”,不做GPU,不卷通用训练 [2][3] - 首颗AI推理芯片(SpinPU-E Series)样片测试结果“非常理想”,其关键指标“单位面积带宽”与Groq LPU披露一致,达到100 GB/s/mm²,这是实现2000Tokens/s速度的底气 [2] - 下一代芯片已在流片中,采用“片上MRAM+SRAM”和“确定性流式乘加单元”技术,目标性能指向2000Tokens/s以上,而目前主流对话模型推理速度仅约30-50Tokens/s [2] - 公司的方案被业界认为是最贴近Groq方案的超大带宽流式处理芯片 [3] 行业定位与竞争 - 公司的单位面积带宽指标是当前AI推理芯片竞争中最具辨识度的硬指标之一,被评价为国内少有的、真正沿着Groq方向发展的团队 [2][3] - 业内传闻NVIDIA已以约200亿美元估值级别锁定Groq的推理技术合作,并计划在NVIDIA GTC 2026发布的新一代AI推理系统中采用Groq芯片设计 [3] 公司发展现状 - 公司此前较为低调,过去两年未对外系统披露产品进展,近期开始对外释放信息的重要背景是其关键技术与样片验证已度过最危险阶段 [2][3] - 目前,公司的新一轮融资已在推进中 [3]
NPU,异军突起
半导体芯闻· 2026-01-20 18:05
行业格局演变 - 基于神经处理单元(NPU)的无晶圆厂公司正通过获得与英伟达的巨额交易,撼动以GPU为中心的AI半导体市场格局,NPU正迅速崛起成为AI训练市场向推理和低功耗专用芯片转型的技术替代方案 [1] - 全球AI无晶圆厂市场通过技术竞争和并购,形成了一个由美国公司Groq、SambaNova Systems、Cerebras、Tenstorrent以及韩国公司Rebellions和FuriosaAI组成的精选结构 [1] 主要公司动态与交易 - 由谷歌TPU开发者创立的Groq公司,因英伟达去年底斥资200亿美元收购其核心技术使用权的消息而备受关注,该交易使Groq约70亿美元的估值溢价近三倍,被视为英伟达巩固其未来在推理型AI半导体领域优势的战略举措 [1] - Cerebras与OpenAI签署了一份价值100亿美元的计算能力供应合同,并且正在洽谈筹集10亿美元的新投资 [2] - 曾与英特尔进行收购谈判的SambaNova,随着市值飙升,改变了策略,选择独立发展 [2] 业务拓展与市场机遇 - NPU产业正将其业务范围从简单的芯片供应扩展到服务器和数据中心基础设施领域 [2] - 中东地区寻求摆脱对中美技术依赖的“自主人工智能”需求已成为其重点目标 [2] - 沙特阿拉伯本土公司Rebellions瞄准沙特数据中心市场,推出性能媲美英伟达旗舰GPU的REBEL-Quad产品 [2] - FuriosaAI正在进行概念验证,计划将其第二代半导体RNGD应用于沙特阿美总部数据中心和工业园区 [2] - 来自Netflix和Oracle等全球科技公司的AI半导体需求正在向现有超大规模数据中心以外的领域多元化发展 [2] 软件生态与政府支持 - 软件生态系统曾被认为是NPU的弱点,但如今也在逐步增强,例如Rebellions将一半的员工聘为软件工程师以押注业务多样性 [2] - 业界认为,必须提供大规模的政府示范支持,才能确保全球竞争力 [2] - Rebellions首席执行官向韩国政府强调,海外国家正使用非英伟达产品构建AI基础设施以实现供应链多元化,并举例沙特阿拉伯去年购买了价值7500亿韩元的Groq芯片,阿联酋购买了价值1.5万亿韩元的Cerebras芯片,而Rebellions公司去年的政府收入仅为70亿韩元 [3] - Rebellions首席执行官请求政府允许将用于英伟达芯片预算的十分之一,用于大规模展示国产AI芯片和示范基础设施建设 [3] 生产与供应计划 - Rebellions计划于今年上半年开始大规模生产REBEL-Quad [3] - FuriosaAI计划从本月底到年底向市场供应多达20,000台RNGD [3]
200亿美元买下Groq,英伟达图啥?
华尔街见闻· 2025-12-25 10:33
交易核心信息 - 英伟达同意支付约200亿美元,以非独家技术授权形式获得初创公司Groq的技术,并聘用其创始人及核心团队[1] - 交易资金规模达到Groq数月前融资时69亿美元估值的约三倍[1] - 交易结构与微软、亚马逊和谷歌过去两年采用的“许可技术+聘用人才”模式类似,旨在规避正式收购可能面临的监管审查[1][4] 战略意图与市场背景 - 交易核心驱动力在于英伟达对AI推理市场的争夺,旨在补齐其在推理芯片领域的高效能短板[1][3] - 英伟达计划将Groq的低延迟处理器整合进其AI工厂架构,以扩展平台能力,服务更广泛的AI推理和实时工作负载[1] - 尽管英伟达GPU在AI模型训练领域占主导,但其现有芯片对于运行聊天机器人等实际应用(推理)而言,往往体积过大且成本高昂,市场需要更廉价、高效的替代方案[3] - Groq声称其芯片在涉及AI应用的特定任务中,数据处理速度优于英伟达[3] 交易架构细节 - 交易并非传统的全资收购,Groq创始人、总裁及其他员工将加入英伟达以推进获授权的技术,而Groq原有的云业务将保留并由新CEO继续运营[4] - 作为许可协议的结果,Groq的投资者(包括贝莱德和Tiger Global Management)将获得包括基于未来业绩的分期付款在内的回报[4] - 此交易类似于英伟达三个月前与网络初创公司Enfabrica达成的交易,当时英伟达斥资逾9亿美元聘用了该公司CEO及工程团队并支付技术许可费[5] 行业竞争格局 - 包括Groq在内的挑战者难以打破英伟达对高端AI芯片市场的严密控制,部分原因在于英伟达专有的CUDA编程语言生态带来了极高的客户粘性[6] - Groq近期经营面临挑战,已将2025年的收入预期下调了约四分之三,部分原因是计划部署芯片的地区缺乏数据中心容量[6] - 市场竞争加剧:谷歌的TPU已成为英伟达GPU的有力竞争者,苹果和Anthropic等公司已使用TPU训练大模型;Meta和OpenAI在研发自己的专用推理芯片;英特尔、Meta、AMD等也在通过收购或吸纳团队进行整合[6] 公司财务状况与策略 - 英伟达正利用其高达600亿美元的现金储备来加速构建防御壁垒并巩固业务[2][7] - 此次约200亿美元的交易资金规模已远超英伟达2019年以69亿美元收购Mellanox的记录,显示出公司愿意为消除潜在威胁并整合前沿技术付出高昂代价[7] - Mellanox业务目前已成为英伟达重要的网络部门,上季度贡献了约200亿美元的收入[7]