AI推理计算
搜索文档
英伟达计划推出全新芯片 OpenAI是大客户
新浪财经· 2026-02-28 11:13
英伟达发布定制化AI推理处理器 - 英伟达计划发布一款专为OpenAI及其他客户定制的全新处理器,旨在打造更快、更高效的工具,这是其业务的重大调整,或将重新定义AI竞赛格局 [1][5] - 该公司正在为AI推理计算设计全新系统,这类计算负责让AI模型响应用户请求,新平台将于下月在圣何塞举办的英伟达GTC开发者大会上正式公布 [1][5] - 新平台将整合初创公司Groq设计的芯片,英伟达于去年底同意以200亿美元获得Groq关键技术授权,并引进其核心管理团队,包括创始人乔纳森·罗斯,这是硅谷史上规模最大的“人才并购”交易之一 [1][3][7] 市场背景与竞争格局 - 推理计算已成为行业激烈竞争的焦点,竞争对手谷歌和亚马逊均已推出芯片,与英伟达旗舰产品抗衡 [1][5] - 科技行业自主编码技术的爆发式增长,催生了对能更高效处理复杂AI任务的新型芯片的需求 [1][5] - 英伟达在设计与销售GPU领域占据主导地位,多数分析师估计,英伟达掌控着90%以上的GPU市场份额 [2][6] - 英伟达旗下高性能的Hopper、Blackwell及Rubin系列GPU,被业内公认为训练超大规模AI模型的顶级产品,但定价高昂 [2][6] 客户动态与行业需求转变 - 部分知情人士称,OpenAI已同意成为这款新处理器的最大客户之一,对英伟达而言是重大胜利 [1][5] - OpenAI上周五在宣布将向英伟达大规模采购专用推理算力时,已间接提及这款新处理器,与此同时英伟达还对其进行了300亿美元投资,OpenAI同时也与亚马逊签署重大新协议,使用其Trainium芯片 [1][5] - 过去一年,随着企业纷纷部署AI智能体等工具,高端计算需求已从训练转向推理,智能体是可相对自主地代用户完成任务的AI系统 [2][6] - 许多开发和运营AI智能体的企业发现,GPU成本过高、功耗过大,且并不完全适配模型实际运行需求,随着智能体AI快速崛起,英伟达面临巨大压力,亟需研发成本更低、能效更高的推理芯片 [2][6] 具体应用场景与合作伙伴 - 编码应用已成为企业AI最重要、最赚钱的应用场景之一,Anthropic的Claude Code被公认为该领域龙头,但Anthropic主要依靠亚马逊云科技和谷歌云旗下团队设计的芯片支撑模型,而非英伟达 [3][8] - Claude最主要的竞争对手之一是OpenAI快速增长的Codex工具,知情人士表示,OpenAI计划利用英伟达新系统升级Codex [4][8] - 上月,OpenAI与Cerebras达成数十亿美元的计算合作,Cerebras主打推理芯片,其首席执行官称该芯片速度快于英伟达GPU [3][7] - 本月,英伟达宣布扩大与Meta的合作,其中包括史上首次大规模纯CPU部署,用于支撑Meta的广告定向AI智能体,这笔交易提前透露了英伟达的战略:跳出GPU范畴,抢占AI细分市场 [4][8] 技术细节与产品挑战 - 自AI热潮兴起以来,英伟达首次面临其旗舰产品的性能瓶颈,随着市场向推理方向转移,部分客户正施压英伟达,要求推出能更高效支撑AI应用的芯片 [2][6] - AI推理计算主要分为两大环节:预填充(模型理解用户提示词的过程)和解码(模型逐词生成回复的过程),对大型AI模型而言,预填充通常更快,而解码往往尤其缓慢 [3][8] - Groq所设计的芯片采用与英伟达截然不同的架构,名为语言处理单元,在推理功能上效率极高,不过截至目前,英伟达对如何运用Groq技术仍三缄其口 [3][7] - 以往,英伟达会在高性能数据中心服务器中将自家Vera CPU与Rubin GPU搭配使用,但部分大客户发现,部分AI智能体任务仅用CPU运行效率更高 [4][8]
200亿美元买下Groq,英伟达图啥?
美股研究社· 2025-12-26 20:27
交易核心信息 - 英伟达同意支付约200亿美元获得初创公司Groq的技术授权,并聘用其核心团队 [5] - 交易形式为非独家技术授权,英伟达将同时聘用Groq的创始人及高管 [5] - 交易资金规模达到Groq数月前融资时69亿美元估值的约三倍 [5] 战略意图与市场背景 - 交易旨在通过获取Groq的专用技术来巩固英伟达在人工智能推理计算领域的统治地位 [5] - 英伟达计划将Groq的低延迟处理器整合进其AI工厂架构,以服务更广泛的AI推理和实时工作负载 [5] - 此举意在补齐英伟达在极其昂贵的高性能训练芯片之外,在推理芯片领域的高效能短板 [5] - 市场一直在寻找更廉价、更高效的AI推理替代方案,而Groq的技术正是为此而生 [8] 交易架构与监管规避 - 交易采用“许可技术+聘用人才”的模式,并非传统的全资收购 [9] - 这种非独家许可交易结构是近期科技巨头规避监管审查的常用手段,微软、亚马逊和谷歌均曾采用类似架构 [10] - Groq原有的云业务将保留在公司内部,由新任CEO继续运营 [9] - 作为许可协议的结果,Groq的投资者将获得包括基于未来业绩的分期付款在内的回报 [10] 技术互补与竞争威胁 - Groq声称其芯片在涉及AI应用的特定任务中,数据处理速度优于英伟达 [8] - 分析师指出,英伟达可能在Groq的新一代技术中看到了威胁,因此选择出手 [8] - 英伟达的GPU在AI模型训练方面占主导,但对于运行聊天机器人等实际应用(推理),其现有芯片往往体积过大且成本高昂 [8] 行业竞争格局 - 谷歌的TPU正成为英伟达GPU的有力竞争者,苹果和Anthropic等公司已使用TPU训练大模型 [11] - Meta和OpenAI也在研发自己的专用推理芯片,以减少对英伟达的依赖 [11] - 初创企业领域整合趋势明显:英特尔正就收购SambaNova谈判,Meta收购了Rivos,AMD则吸纳了Untether AI的团队 [12] - 尽管获得数十亿美元风险投资,包括Groq在内的挑战者一直难以打破英伟达对高端AI芯片市场的严密控制,部分原因是其专有的CUDA编程语言生态形成了极高客户粘性 [11] 公司财务状况与策略 - 英伟达正利用其高达600亿美元的现金储备加速构建防御壁垒 [6] - 此次200亿美元交易资金规模已远超以往(如2019年以69亿美元收购Mellanox),显示出公司愿意付出高昂代价以消除潜在威胁并整合前沿技术 [13] - Groq近期的经营状况反映了挑战巨头的难度,公司最近将2025年的收入预期下调了约四分之三 [11] - Groq曾在7月预计其云业务今年收入将超过4000万美元,总销售额超过5亿美元 [11]