Workflow
AI推理
icon
搜索文档
英伟达(NVDA.US)牵手Groq:AI推理时代逼近 高毛利神话或迎考验
智通财经网· 2025-12-27 07:40
文章核心观点 - 英伟达从AI芯片初创公司Groq获得授权 此举被市场视为一项防御性战略 旨在应对AI推理领域日益激烈的竞争 并确保公司在未来算力格局中保持关键地位 [1] - 交易标志着英伟达对竞争格局的判断出现变化 公司可能在维持长期增长潜力的同时 为未来盈利能力可能面临的压力做准备 [1] - 合作可能促成GPU与LPU的互补整合 但若专用推理芯片在英伟达产品组合中占比提升 其高毛利率将面临下行压力 [3] 市场背景与英伟达现状 - 过去两年 英伟达GPU是AI革命的主力引擎 自2022年11月ChatGPT问世前 公司单季营收仅约59亿美元 而最新一个季度已接近其10倍 [1] - 英伟达在最新一个季度实现了73%的毛利率 凸显了其在AI训练领域几乎无可撼动的市场地位 [1] - GPU的优势在于通用性 既能用于大模型训练 也能承担推理任务 [2] 交易动机与战略解读 - 市场普遍将此交易类比为Meta在2012年收购Instagram 视为先下手为强的防御性策略 旨在化解潜在竞争风险 [1] - 随着AI应用落地 推理正在成为算力需求增长最快的环节 竞争也在此加速 [2] - 交易表明英伟达已经意识到 即便GPU主导训练市场 推理的快速崛起也可能需要更专用的芯片 [2] - 此举意味着英伟达正在为可能下降的盈利能力做准备 以维持公司长期增长潜力 [1] 竞争格局与行业趋势 - 在AI推理领域 专用芯片开始显现优势 谷歌、微软、亚马逊等科技巨头均已布局定制AI芯片 同时有大量初创企业涌入赛道 [2] - 多数竞争者已放弃在训练层面正面挑战英伟达 竞争焦点转向推理领域 [2] - Groq是专用推理芯片领域的代表之一 其主打的LPU专为高效推理而生 [2] - Groq创始人曾是谷歌TPU团队成员 并将在交易后为英伟达效力 [2] 合作细节与未来展望 - 交易的具体条款尚未披露 英伟达从Groq手中购买了一项授权 [1] - 未来市场或将看到同时搭载GPU与LPU的英伟达服务器 两类芯片可能形成互补 [3] - Groq将接入英伟达二十余年积累的AI软件生态 而自身的推理软件能力也可能反哺英伟达 [3] - 此次合作为此前前景一度黯淡的Groq带来了新的生机 [2] 市场反应与财务影响 - 短期投资者态度偏乐观 英伟达股价在交易消息后上涨1.02% [3] - 中长期看 若Groq LPU在英伟达产品组合中的占比提升 其高毛利率势必面临下行压力 [3] - 此次合作被视为AI投资浪潮的一个拐点信号 如果推理成为AI算力的主战场 英伟达必须确保自己在场 [3]
黄仁勋打开一个世界
投资界· 2025-12-26 17:41
文章核心观点 - 英伟达以200亿美元现金与AI芯片初创公司Groq达成一项非排他性技术许可协议,并吸纳其核心团队,此举被解读为一种“人才收购”策略,旨在快速获取顶尖人才和技术,同时规避传统并购可能面临的监管审查 [1][2][4][7][8] - 该交易的核心战略意图是整合Groq的低延迟处理器技术,以加强英伟达在AI推理和实时工作负载市场的布局,应对AI工作负载从训练向推理迁移的行业趋势 [25] - 科技巨头正频繁采用“人才收购”模式,以资本手段吸收潜在的颠覆性初创公司,这可能正在收窄其他市场参与者的竞争窗口期 [14][15][35] 交易事件本身 - 英伟达官宣与Groq达成交易,最初被广泛报道为价值200亿美元的收购,但随后双方澄清为一项非排他性技术许可协议,并非收购公司 [2][4][5] - 此交易金额200亿美元,远超英伟达2019年收购Mellanox的70亿美元,成为其有史以来最大规模的交易 [3] - 根据协议,Groq创始人兼首席执行官Jonathan Ross、总裁Sunny Madra及其他高管将加入英伟达,而Groq公司将继续作为独立实体运营,由原首席财务官接任CEO [10][13] - Groq的主要投资方Disruptive透露,其自2016年成立以来已向Groq投资超过5亿美元,交易进展迅速 [9][10] 交易背景与战略意图 - 英伟达CEO黄仁勋在内部邮件中明确,计划将Groq的低延迟处理器整合到英伟达的AI工厂架构中,以服务更广泛的AI推理和实时工作负载 [25] - Groq由前谷歌工程师创办,是谷歌张量处理单元(TPU)的核心班底,专注于高性能AI加速器芯片,其自研的语言处理单元(LPU)声称运行大模型的速度比传统方案快10倍,能耗只有十分之一 [21][25] - 交易发生前,Groq于2024年9月刚完成一轮7.5亿美元的融资,估值达到约69亿美元,且公司2025年营收目标为5亿美元,处于高速增长期 [22][24] - 截至2025年10月底,英伟达账上现金和短期投资达606亿美元,相比2023年初的133亿美元翻了近5倍,为其大手笔投资提供了充足资金 [27] 行业趋势:“人才收购” - 科技行业频繁出现“Acqui-hire”(人才收购)模式,即巨头以重金获取初创公司的核心团队和技术授权,同时避免触发反垄断审查 [7][14] - 近期案例包括:微软6.5亿美元挖走Inflection创始人及团队 [15];亚马逊约4亿美元挖走Adept创始人及团队并获得技术授权 [16];谷歌约27亿美元挖走Character.AI创始人及30多人核心团队 [16];Meta约150亿美元挖走Scale AI创始人及核心团队 [16];谷歌约24亿美元挖走Windsurf创始人及研发团队 [17];苹果吸收了Prompt AI核心团队 [18] - 此类交易的核心目的各异,有时是为了关键人物(如谷歌请回Transformer论文作者),有时是为了技术转让(如谷歌挖走Windsurf团队后推出自己的AI编程工具) [19][20] 行业竞争格局 - 除Groq外,其他AI芯片初创公司也面临整合:英特尔正深入谈判有意收购AI芯片初创公司SambaNova [31];另一家明星企业Cerebras在2025年10月撤回IPO申请,转而完成了一轮超过10亿美元的融资 [33] - Groq、SambaNova和Cerebras最初都以挑战英伟达GPU的“颠覆者”形态登场 [34] - 英伟达近期还进行了其他投资,包括投资AI与能源基础设施公司Crusoe、AI模型开发商Cohere,追加对云服务商CoreWeave的投资,并宣布计划向OpenAI投资最高1000亿美元,向英特尔投资50亿美元 [28][29] - 当巨头开始用资本手段吸收潜在的颠覆者,留给其他玩家的竞争窗口期可能正在收窄 [35]
200亿美元拿下Groq,英伟达“史上最大收购”到底图啥?
36氪· 2025-12-26 15:33
交易核心信息 - 英伟达与Groq达成非独家许可协议,将把Groq的AI推理技术整合进未来产品中 [1] - Groq创始人兼首席执行官Jonathan Ross、总裁Sunny Madra以及部分核心员工将加入英伟达 [1] - 据投资机构Disruptive报道,此次交易金额将达到200亿美元,且将以现金形式进行支付 [1] - 若交易金额属实,此次收购将成为英伟达成立三十多年以来金额最高的收购案,远超当年对Mellanox 70亿美元的价格 [1] Groq的技术与产品 - Groq不生产GPU,它生产一种名为LPU的处理器,旨在彻底颠覆冯·诺依曼架构 [1] - 创始人Jonathan Ross是谷歌TPU项目最早的推动者之一,但他意识到GPU和TPU本质上是在传统架构上“打补丁” [2] - LPU的核心逻辑与GPU背道而驰,其设计追求“确定性”计算,以解决AI推理中的延迟波动问题 [3] - Groq彻底取消了硬件层面的调度器,采用“软件定义硬件”模式,编译器在代码编译阶段就精确规划数据在芯片内的流动 [4] - 在评测中,Groq的LPU在处理大规模上下文时跑出了每秒500到800个Token的恐怖速度,实现了体验上的质变 [5] - Groq使用SRAM来取代英伟达GPU依赖的HBM,SRAM带宽比HBM高出几个数量级且延迟更低,并通过集群设计构建超低延迟的“显存池” [6] - 该设计不依赖昂贵的显存封装和复杂的CoWoS封装工艺,具备更强的量产潜力 [6] 英伟达的收购战略考量 - 收购兼有获取市场占有率的“补全型”和消除生存威胁的“扼杀型”双重目的 [6] - AI的下半场属于推理,市场对算力的需求将从吞吐量转向对“毫秒级响应”的极致追求,而这是英伟达当前的短板 [7] - 收购有“锁死”竞争对手推理能力快速发展的考量,Groq的LPU原本是二线云厂商和AI软件公司用以对抗英伟达性价比优势的谈判筹码 [8] - 通过将Groq收入囊中,英伟达让试图绕过其生态、通过Groq构建差异化竞争力的对手们失去了目标 [8] - 英伟达正在经历从“通用芯片”向“专用推理架构”的产品开发,Groq的“确定性架构”和“软件定义硬件”思路是其最稀缺的补丁 [9] - 通过整合Groq核心团队,英伟达可将LPU的低延迟特性深度融入下一代超级芯片,推动纯推理产品开发进度,保证后续竞争力 [10] - 此举相当于在自身巨轮上加装一台为推理时代量身定制的新引擎 [11] 行业背景与影响 - 全球云服务巨头如谷歌、亚马逊、微软已通过自研芯片(TPU、Trainium、Maia)试图摆脱对英伟达的依赖 [8] - 在AI行业从“不计成本训练”转向“大规模商业推理”的2025年,Groq的方案在英伟达的铁幕上凿开了一道裂缝 [6] - 收购Groq是英伟达利用先发优势积累的庞大现金流,为自己买下了一张通往“后GPU时代”的船票 [12] - 英伟达正构筑一道由先进制程、软件生态以及足以颠覆自己的“叛逆技术”所构成的护城河 [12] - 其战略逻辑是:如果有人要颠覆英伟达,那个人最好就是英伟达自己 [13]
英伟达急了?或被谷歌TPU逼到墙角,黄仁勋不惜代价也要“收编”Groq
华尔街见闻· 2025-12-26 11:56
文章核心观点 - 英伟达与Groq达成技术许可及人才引进协议,其深层战略意图在于获取与谷歌TPU同源的AI推理架构思想,以应对AI竞争重心从训练转向推理所带来的结构性挑战,这是一场防御性反击,标志着AI基础设施竞争格局的深刻变化 [2][3][13][14] 交易本质与战略意图 - 交易形式为技术许可加核心人才转移,Groq公司保持独立运营,但创始人兼首席执行官Jonathan Ross、总裁Sunny Madra及部分核心工程人员将加入英伟达 [1] - 此举并非普通技术合作,核心在于获取Groq背后的架构思想,该思想与谷歌TPU高度同源,旨在帮助英伟达在推理架构上追近甚至抹平与谷歌TPU的差距 [2][3] - 英伟达的选择是“引入”而非“自研”,直接吸纳已验证的TPU思维方式比从零构建更快、更现实 [10] - 此前市场传闻英伟达拟以高达200亿美元全资收购Groq,虽被否认但凸显了其紧迫感,最终方案降低了监管风险,但实质上已掌握最关键能力 [11][12] 行业竞争格局演变:从训练到推理 - AI竞争重心正从训练转向推理,训练是一次性投入决定能力上限,推理是持续性支出决定商业下限 [6] - GPU在训练领域占据统治地位,但在推理环节,TPU凭借其高度定制的ASIC架构,在单位能耗、延迟可控性及规模化推理成本上正快速逼近甚至反超,更贴合大模型商业化阶段“算得起”的需求 [4][5] - TPU不仅是芯片,更是一种成本结构武器,让谷歌云逐步摆脱对英伟达的依赖,并构建未来十年的关键护城河 [3][6] - 当客户开始计算长期推理成本时,GPU的高溢价模式首次遭遇结构性挑战 [6] Groq公司的价值与角色 - Groq由前谷歌芯片高管、TPU早期核心参与者Jonathan Ross创立,其架构理念强调低延迟、确定性执行和极致推理效率,与TPU设计哲学高度同源,但与英伟达传统GPU体系存在张力 [8][9] - Groq 2024年目标收入约为5亿美元,其财务规模并非英伟达关注重点,英伟达真正看重的是其技术理念及获取该技术所需的时间 [12] - Groq的价值在于其承载的、与TPU同源的架构思想,是英伟达应对推理时代挑战的关键拼图 [7] 对英伟达与谷歌竞争的影响 - 此次交易是英伟达面对TPU崛起焦虑的体现,是一次防御性反击 [3][13] - 若英伟达借此成功缩小与TPU在推理架构上的差距,谷歌与OpenAI/英伟达阵营之间不断扩大的技术与生态裂口可能迅速收敛,竞争格局将重回拉锯状态 [3] - 真正的悬念在于谷歌是否会启动“红色警报”阻止交易或以更强硬方式回应,若TPU继续深度绑定Gemini并成为谷歌云核心差异化能力,对抗才刚刚开始 [4][16] - 此次交易是一个明确信号:推理时代大门已打开,AI基础设施竞争不再只依赖更大的GPU,连英伟达这样的霸主也不得不提前调整战略 [14][15][16]
连英伟达都开始抄作业了
钛媒体APP· 2025-12-26 09:38
交易核心信息 - 英伟达宣布以200亿美元现金与AI芯片初创公司Groq达成技术许可协议[1] - 交易结构特殊:并非正式收购,Groq保持独立运营,但创始人Jonathan Ross、总裁Sunny Madra等核心团队全部加入英伟达,英伟达获得Groq几乎所有核心技术资产,仅排除GroqCloud云计算业务[1] - 200亿美元对价是Groq三个月前69亿美元估值的2.9倍,构成罕见的“估值倒挂”[1] - 分析师认为交易本质是英伟达用金钱换时间,将潜在颠覆者纳入麾下,同时规避反垄断审查[1] AI芯片行业趋势与市场格局 - AI产业正从集中式模型训练全面迈入规模化推理落地新阶段[1] - AI推理市场正以年复合增长率65%的速度扩张,预计2025年规模突破400亿美元,2028年将达到1500亿美元[1] - 英伟达在推理赛道面临多方挑战:谷歌TPU凭借成本优势抢夺客户,AMD MI300X拿下微软40亿美元订单,华为昇腾在中国市场份额已飙升至28%[1] - 预计到2027年,英伟达市场份额将维持在75-80%,AMD占10-12%,谷歌TPU占8-10%,其他厂商份额仅剩2-3%[14] Groq的技术优势与市场表现 - Groq由谷歌TPU核心开发者Jonathan Ross于2016年创立,旨在打造专为AI推理优化的专用芯片LPU[2] - LPU采用“可编程流水线”设计,解决GPU的“内存墙”问题,带来三大优势:极致的低延迟(首token响应时间仅0.22秒,比GPU快5-18倍)、超高能效比(功耗300-500W,是英伟达H100的三分之二,能效比是GPU的10倍以上)、确定性计算[3] - LPU内存带宽高达80TB/s,是HBM的10倍,处理Llama 2-70B大模型时吞吐量达241 tokens/秒,是其他云服务商的2倍以上,能将算力成本降低至GPU的三分之一[3] - Groq估值在2024年8月至2025年9月间暴涨146%,累计融资超30亿美元,服务超200万开发者,客户包括Meta、沙特阿美(15亿美元协议)、加拿大贝尔等[4][5] 英伟达面临的竞争压力与战略动机 - 尽管英伟达2025年股价累计涨幅超35%,持有现金及短期投资达606亿美元,但在推理市场面临加剧的竞争压力[6] - 谷歌TPU v7性能接近英伟达Blackwell,凭借自研芯片+云服务一体化优势提供30%-40%的成本优势,并开始对外销售[6] - AMD MI300X兼容CUDA生态,切换成本低,价格比同性能GPU低20%-30%,2025年获得微软Azure 40亿美元订单,市场份额从10%提升至15%,预计全年AI芯片营收超50亿美元,同比增长120%[7] - 受出口管制影响,英伟达高端芯片无法进入中国,华为昇腾市场份额从2023年15%飙升至2025年28%,英伟达份额则从70%跌至54%[7] - GPU在推理场景存在天生短板,而Groq的LPU精准命中了低延迟、高能效、低成本的需求痛点[8] - 200亿美元交易对英伟达财务压力不大,仅占其606亿美元现金的33%,潜在收益巨大:若助其维持推理市场70%以上份额,按2028年1500亿美元市场规模计算,每年可带来超1000亿美元营收[10] 交易的战略整合与潜在影响 - 交易旨在实现“人才+技术+渠道”三位一体整合:获得Groq创始人Jonathan Ross等核心人才、LPU架构等核心技术、以及沙特阿美等客户渠道[11] - 计划整合GPU与LPU,形成“训练用GPU,推理用LPU”的异构计算解决方案,覆盖AI全流程,进一步强化生态壁垒[11] - 技术整合的关键挑战在于软件生态兼容,需将Groq的GroqWare套件和GroqFlow工具链融入英伟达CUDA生态[12] - 若软件整合成功,英伟达推理解决方案可实现成本降低至GPU三分之一,延迟降低至200毫秒以内,部分场景达50毫秒[13] - 推理成本降低和延迟优化将加速AI应用规模化落地,推动AI从实验室走向产业,2026年推理在AI服务器工作负载中占比预计达70.5%[13] 行业创新困境与未来趋势 - 交易暴露AI芯片初创公司创新困境:有颠覆性技术但难以打破巨头生态壁垒,客户切换CUDA生态成本高达数千万美元[5][15] - 行业进入整合阶段,创新者或被收编或在生态壁垒前耗死,市场“固化”趋势加剧[14] - 未来3-5年行业三大趋势:1) “GPU+LPU”异构计算成为主流,超80%的AI数据中心将采用此架构;2) 能效比成为核心竞争力;3) “软件定义硬件”成为新发展方向[17] - 尽管巨头垄断主流市场,但边缘场景和垂直行业(如工业物联网、医疗诊断)因需求小众、巨头覆盖不足,仍为初创公司提供机会[18] - 推理技术进步将推动AI计算向边缘端迁移,形成云端、边缘、终端三元共存格局,加速AI赋能千行百业[16]
英伟达重金收编潜在挑战者
北京商报· 2025-12-25 22:41
交易核心信息 - 英伟达与AI推理芯片初创公司Groq达成一项非独家授权协议 英伟达支付约200亿美元现金 获得Groq的核心AI推理技术知识产权和相关资产 [2] - 交易并非全资收购 Groq的云服务业务将继续独立运营 其创始人兼CEO、总裁等核心高管及团队将加入英伟达 [2] - 交易资金规模达200亿美元 远超以往 达到Groq数月前融资时69亿美元估值的约3倍 [3][7] 交易战略意图与行业背景 - 交易核心驱动力在于英伟达对AI推理市场的争夺 英伟达GPU在AI训练领域占主导 但其芯片对于运行聊天机器人等推理应用而言体积过大且成本高昂 市场寻求更廉价高效的替代方案 [5] - 英伟达计划将Groq的低延迟处理器整合进其AI工厂架构 以扩展平台能力 服务更广泛的AI推理和实时工作负载 补齐在推理芯片领域的高效能短板 [3] - 芯片咨询公司分析师指出 英伟达可能在Groq即将推出的新一代技术中看到了威胁 因此选择出手 [5] - 此次交易模式为“许可技术+聘用人才” 与微软、亚马逊和谷歌过去两年采用的模式如出一辙 旨在规避日趋严格的反垄断审查 高效获取前沿技术与稀缺人才 [3][4] 交易双方状况分析 - **英伟达方面**:截至10月底 英伟达持有的现金及短期投资规模为606亿美元 高于2023年初的133亿美元 公司近年来持续加大对芯片初创公司及整个生态系统的投资 例如计划向OpenAI投资最高1000亿美元 向英特尔投资50亿美元 [6][7] - **Groq方面**:公司成立于2016年 由谷歌TPU项目核心研发成员创立 2024年2月推出新款AI芯片 声称推理速度较英伟达GPU提高10倍甚至更高 [1] 但近期经营面临挑战 将2025年收入预期下调了约四分之三 原预计云业务今年收入超4000万美元 总销售额超5亿美元 [7] 公司已与Meta、IBM、沙特阿美等达成重要合作 [3] 交易影响与展望 - 对英伟达而言 通过此次交易获得了更具成本效益且速度更快的芯片设计能力 以巩固其市场主导地位 [5][7] - 对Groq而言 交易带来约200亿美元的充足现金流 极大缓解了公司财务压力 为现有投资者创造了可观回报 其技术有望借助英伟达资源触达更丰富应用场景 同时保留了独立的云服务业务和品牌 为未来发展保留了自主性 [8]
英伟达豪掷1400亿元“收编”芯片独角兽
21世纪经济报道· 2025-12-25 22:09
交易核心事件 - 2024年12月24日,英伟达与AI芯片初创公司Groq达成非独家许可协议,获得其推理技术授权,Groq创始人、总裁及核心团队成员将加入英伟达 [1] - Groq将继续作为独立公司运营,由Simon Edwards接任CEO,其云服务保持正常运行 [1] - 此前有报道称英伟达以200亿美元(约合1402亿元人民币)现金收购Groq资产,但英伟达官方否认收购,仅确认获得知识产权授权并聘请人才 [1] - 双方未披露该交易的财务条款 [1] Groq公司背景与技术 - Groq由谷歌前员工Jonathan Ross于2016年创立,核心团队曾参与研发谷歌TPU [3] - 公司推出云端推理芯片GroqChip,可实现16个芯片互连,配置230 MB SRAM,算力达750 TOPS [3] - 公司采用“编译器优先”策略,并提出了专门用于大语言模型推理的“LPU”(语言处理单元)概念 [5] - 公司称其LPU芯片速度比英伟达H100快10倍,成本仅为其十分之一 [5] - LPU芯片采用SRAM,其速度比GPU所用存储器快约20倍,功耗更低,生产和部署速度更快 [5] - 2021年4月,Groq获得3亿美元融资,估值突破10亿美元,成为独角兽 [5] - 2024年3月,Groq收购Definitive Intelligence并组建GroqCloud部门,直接提供云端算力服务 [5] Groq市场表现与融资 - 2024年AI需求重心从训练转向推理,Groq凭借在大模型推理速度上的表现获得关注 [6] - 2024年8月、2025年2月和9月,Groq分别完成三轮融资,引入思科、三星、德国电信等产业投资者 [6] - 最新一轮融资后,公司估值达到69亿美元 [6] - Groq已成为英伟达在AI推理市场有力的潜在竞争者之一 [6] 技术路线与市场格局分析 - 在AI训练端,英伟达已占据绝对领先地位;但在推理端,技术路线呈现百花齐放态势,包括Cerebras、Groq及云厂商自研芯片等 [9] - 英伟达主力产品(如Blackwell系列)依赖台积电CoWoS先进封装和HBM [9] - Groq的LPU架构摒弃外部HBM,直接采用片上SRAM,其片上内存带宽高达80TB/s以上,而顶尖GPU的HBM带宽仅约为8TB/s [9] - 分析师指出,SRAM速度是HBM的10倍,且Groq路线绕过了对台积电CoWoS产能的依赖,消除了昂贵的封装瓶颈 [9] - 英伟达CEO黄仁勋曾评论称,Groq等专用AI芯片适用于特定任务,但难以从软件领域的快速创新中获益 [7] - 英伟达的商业模式是提供完整的数据中心方案模块,由客户集成,而非单纯销售芯片 [7] 交易战略意义与影响 - 通过“收编”Groq,英伟达整合了潜在技术对手,并可能规避反垄断风险 [10] - 交易使英伟达得以开辟一条不依赖HBM供应链的新技术战线,专门针对高频、低延迟推理市场 [10] - 交易的核心资产被认为是Groq的技术工程团队,其创始人Jonathan Ross师从杨立昆,并参与设计了谷歌第一代TPU芯片 [10] - Groq的早期架构师Dennis Abts已于2022年加入英伟达,此次交易将把剩余“技术灵魂人物”全数收编,有助于英伟达整合技术并修补实时推理短板 [10] - 此次交易模式被称为“收购式招聘”,是硅谷近年来的新型交易模式,此前Meta、谷歌、微软在AI领域也有类似操作 [11] - 有分析认为,这种模式可能让只有少数拥有优秀AI技能的员工和创始人受益 [11] - 交易公布当日(12月24日),英伟达股价收于188.61美元/股,盘后微跌0.32% [11]
英伟达“收编”芯片独角兽Groq,欲补齐推理算力拼图?
21世纪经济报道· 2025-12-25 20:08
事件核心 - 英伟达与AI芯片初创公司Groq达成非独家知识产权许可协议,并聘请其核心工程团队,但否认了此前传闻的200亿美元现金收购[1] - Groq将继续作为独立公司运营,其云服务不受影响,Simon Edwards将接任首席执行官[1] - 交易的具体财务条款未披露[1] Groq公司背景与技术 - Groq由谷歌前员工Jonathan Ross于2016年创立,核心团队曾参与谷歌TPU研发[2] - 公司推出云端推理芯片GroqChip,采用“编译器优先”策略,并提出了专门用于大语言模型推理的“语言处理单元”概念[2] - LPU芯片采用SRAM,其速度据称比GPU所用存储器快约20倍,功耗更低,生产和部署速度更快[2] - Groq称其LPU芯片速度比英伟达H100快10倍,成本仅为其十分之一[2] - 2021年4月,Groq完成3亿美元融资,估值突破10亿美元成为独角兽[3] - 2024年,Groq通过多轮融资引入思科、三星等产业投资者,最新一轮融资后估值达到69亿美元[3] 市场格局与竞争 - 2024年AI需求重心从训练转向推理,为Groq等芯片厂商提供了机会[3] - Groq已成为英伟达在AI推理市场有力的潜在竞争者之一[3] - 在训练端英伟达已占据领先地位,但在推理端,技术路线呈现百花齐放态势,包括Cerebras、Groq及云厂商自研芯片等[6] - 英伟达CEO黄仁勋曾评价,Groq等专用AI芯片适用于特定任务,但难以从软件创新速度中获益[4] 交易动机与影响分析 - 分析认为,英伟达通过此次交易可从技术和人才上补齐其在AI推理领域的版图[6] - Groq的LPU架构摒弃外部HBM,直接采用片上SRAM,其披露的片上内存带宽高达80TB/s以上,而目前顶尖GPU的HBM带宽仅约为8TB/s[6] - 该技术路线绕过了对台积电CoWoS先进封装产能和昂贵HBM供应链的依赖[6] - 交易的核心资产被认为是Groq源自谷歌的顶尖技术工程团队,其创始人Jonathan Ross师从杨立昆,并负责设计了谷歌第一代TPU的核心架构[7] - 此次交易被视作“收购式招聘”,英伟达通过非独家授权整合了潜在技术对手,规避了反垄断风险,并开辟了不依赖HBM的新战线[7] - 类似“收购式招聘”的交易模式在AI领域形成热潮,Meta、谷歌、微软等科技巨头均有类似操作[8]
英伟达急了?或被谷歌TPU逼到墙角,黄仁勋不惜代价也要“收编”Groq
华尔街见闻· 2025-12-25 18:21
英伟达与Groq达成技术许可协议的核心观点 - 英伟达与Groq达成非独家技术许可协议,整合其AI推理技术,Groq创始人、总裁及部分核心工程人员将加入英伟达,但Groq公司保持独立运营[1] - 此举并非普通技术合作,英伟达真正看重的是Groq背后与谷歌TPU高度同源的架构思想,旨在应对AI竞争重心从训练转向推理的行业变局[1] - 英伟达此举是一场防御性反击,旨在借助Groq的技术与人才,在推理架构上追近甚至抹平与谷歌TPU的差距,从而改变竞争格局[1][8] AI基础设施竞争格局演变 - AI竞争重心正从训练转向推理,训练是一次性投入决定能力上限,推理是持续性支出决定商业下限[4] - 在推理环节,谷歌TPU凭借为神经网络高度定制的ASIC架构,在单位能耗、延迟可控性及规模化推理成本上显现优势,正在快速逼近甚至反超统治训练环节的GPU[2][3] - TPU不仅是芯片,更是一种成本结构武器,让谷歌云逐步摆脱对英伟达的依赖,并可能成为其未来十年的关键护城河[2][4] - AI基础设施的战争已经改变,未来竞争不再只依靠更大的GPU,云厂商正用自研芯片重塑成本曲线[9] 英伟达的战略考量与Groq的价值 - Groq由谷歌TPU早期核心参与者创立,其架构理念强调低延迟、确定性执行和极致推理效率,与TPU设计哲学高度同源,与英伟达传统GPU体系存在张力[6][7] - 英伟达选择“引入”而非“自研”,直接吸纳已验证的TPU思维方式,是为了更快、更现实地构建新架构,核心目的是争夺时间[7] - 尽管市场曾传闻英伟达拟以高达200亿美元全资收购Groq,但最终落地为技术许可加核心人才转移的“非收购”结构,这降低了监管风险,但实质上掌握了最关键的能力[7] - Groq公司2024年目标收入约为5亿美元,其价值不在于财务规模,而在于其架构思想与人才[7] 交易对行业竞争的可能影响 - 一旦英伟达借助此次技术引入在推理架构上取得进展,谷歌与OpenAI/英伟达阵营之间不断扩大的技术与生态裂口可能会迅速收敛,竞争格局将重新回到拉锯状态[1] - 真正的悬念在于谷歌是否会启动“红色警报”阻止交易,或以更强硬方式回应[2] - 如果TPU继续深度绑定Gemini模型并成为谷歌云核心差异化能力,那么英伟达与谷歌在AI基础设施上的对抗才刚刚开始[10] - 此次交易是一个明确信号,表明推理时代的大门已经打开,连行业霸主也不得不提前调整战略[10]
200亿美元买下Groq,英伟达图啥?
硬AI· 2025-12-25 16:47
交易概览 - 英伟达同意支付约200亿美元,以非独家技术授权形式获得初创公司Groq的技术,并聘用其创始人、高管及核心团队 [2][3] - 交易金额达到Groq数月前融资时69亿美元估值的约三倍 [3] - 交易结构为“许可技术+聘用人才”,并非传统全资收购,Groq原有云业务将保留并由新CEO继续运营 [4][7] 战略意图与市场背景 - 核心意图是消除在高效、低成本AI推理芯片领域的潜在威胁,并直接吸纳顶尖团队以补齐自身技术短板 [2] - 旨在获得更具成本效益且速度更快的芯片设计能力,以应对日益增长的AI应用运行需求 [3] - 计划将Groq的低延迟处理器整合进英伟达的AI工厂架构,以扩展平台能力,服务更广泛的AI推理和实时工作负载 [4] - 尽管英伟达GPU在AI模型训练领域占主导,但其现有芯片对于运行聊天机器人等实际应用(推理)而言往往体积过大且成本高昂,市场在寻找更廉价高效的替代方案 [5] - 分析师指出,Groq的后续两代产品可能构成威胁,英伟达因此选择出手 [5] 交易架构与行业趋势 - 采用“许可+挖人”的特殊架构,是近期科技巨头为规避日益严格的反垄断审查的常用手段 [3][8] - 微软、亚马逊和谷歌过去两年均曾采用类似模式吸纳AI初创公司的创始人及核心技术 [4][8] - 此交易类似于英伟达三个月前与网络初创公司Enfabrica达成的交易,当时英伟达斥资逾9亿美元聘用了该公司CEO及工程团队并支付技术许可费 [8] - 作为许可协议结果,Groq的投资者将获得包括基于未来业绩的分期付款在内的回报 [8] 市场竞争格局 - 包括Groq在内的挑战者难以打破英伟达对高端AI芯片市场的严密控制,部分原因在于其专有的CUDA编程语言生态形成了极高的客户粘性 [10] - Groq近期经营面临挑战,将2025年收入预期下调了约四分之三,原因为计划部署芯片的地区缺乏数据中心容量 [10] - Groq曾在7月预计其云业务今年收入将超过4000万美元,总销售额超过5亿美元 [10] - 市场竞争加剧:谷歌TPU已成为英伟达GPU的有力竞争者,苹果和Anthropic等公司已使用TPU训练大模型;Meta和OpenAI在研发自己的专用推理芯片;英特尔、Meta、AMD等也在通过收购或吸纳团队进行整合 [10] 财务与资源部署 - 英伟达正利用其高达600亿美元的庞大现金储备来巩固业务并构建防御壁垒 [4][13] - 此次约200亿美元的交易规模已远超以往,显示出公司愿意付出高昂代价以消除潜在威胁并整合前沿技术 [13] - 此前最大一笔收购是2019年以69亿美元收购Mellanox,该业务上季度贡献了约200亿美元的收入 [13]