文章核心观点 - 英伟达以约200亿美元的天价收购AI芯片独角兽Groq的团队和非独家技术授权,此举旨在强化其在AI推理市场的布局,并标志着可重构计算架构作为继GPU和ASIC之后的第三大主流AI芯片技术路径获得巨头认可,其稀缺性与市场价值被显著拉高[4][5][6][23][24] - 随着大模型进入规模化部署,AI算力消耗形态向推理倾斜,对低延迟、高能效和高并发提出更高要求,这为可重构芯片提供了巨大的市场机遇[7][23] - 以清微智能为代表的国产可重构AI芯片企业,在资本与产业支持下已实现规模化商用并启动IPO,成为中国实现算力自给和规避单一架构风险的重要方向[19][20][22] 交易细节与战略意图 - 交易金额高达约200亿美元,超过了英伟达历史上的任何一笔并购,预计将消耗其2025年底可能超过700亿美元现金储备的近三分之一[4][9] - 英伟达收购的核心目标是获取Groq在AI推理领域的技术与团队,计划将其低延迟处理器集成到NVIDIA AI Factory架构中,以服务更广泛的AI推理与实时工作负载[7][16] - Groq在交易前并未寻求出售,其在2025年9月完成新一轮7.5亿美元融资后,投后估值约为69亿美元,2025年营收目标为5亿美元[10] Groq的技术与市场价值 - Groq的核心技术是其特有的LPU芯片,采用软件定义硬件的可重构数据流架构,也被称为“进阶版TPU”[4][11] - 该芯片专为推理优化,在int8精度下峰值算力达750TOPS,运行万亿参数大模型可实时生成token[13] - 技术实现依赖于TSP架构、极致确定性和采用SRAM,通过编译器实现时钟级确定性,相比GPU采用的外部HBM,SRAM访问速度更快[14] - 在推理延迟和吞吐上,Groq芯片能实现比GPU快5-18倍、能效比高10倍的突破[18] - Groq的市场价值还包括其在中东的布局:已获得沙特阿拉伯15亿美元的投资承诺,并于2024年12月建成沙特最大的推理集群[10] AI芯片主流技术路径形成 - 英伟达收购Groq、英特尔洽购SambaNova等动作,标志着主流AI芯片三大技术流派正式形成[17] - GPU:擅长暴力并行计算,生态最强,是大模型训练首选,但推理时存在高能耗劣势,代表企业有英伟达、摩尔线程等[17] - ASIC/DSA:专用芯片,为AI运算极致优化,但处理非矩阵运算时性能下降,代表企业有谷歌、寒武纪、昆仑芯等[17] - 可重构:根据数据流动态重构计算路径,能适应多元化算法,在能效和延迟上优势明显,代表企业有SambaNova、Groq以及清微智能等[17] - 可重构架构的实现方法主要有两种:Groq采用的依靠编译器实现逻辑重构;以及更经典的依靠硬件内部可编程交换矩阵实现物理连接动态重构[18] 国产可重构芯片的进展与机遇 - 清微智能作为全球最早实现可重构计算商用的企业之一,已完成超20亿元C轮融资,并启动上市筹备,目标成为国内“非GPU”新型架构芯片领域首个上市标杆企业[19][20] - 公司得到国家集成电路产业投资基金、多家国资机构以及蚂蚁集团、百度、商汤、兆易创新等产业投资方的支持[20] - 在先进制程受限背景下,可重构芯片通过架构创新换取性能,成为国产替代的重要方向[20] - 清微智能2025年算力卡订单超过3万张,累计出货超过3000万颗,在全国十多座千卡规模智算中心实现规模化落地,出货量已跻身国内AI芯片第一梯队[22] - 公司下一代芯片性能将大幅提升,其架构具备与3D芯片、晶圆级芯片等前沿技术结合的升级路径,并拥有高效的多芯片互连技术TSM-LINK[20]
英伟达200亿美元“押注”背后的深意