报道:英伟达在下月GTC大会推出“新推理芯片”,融入Groq LPU设计

文章核心观点 - 英伟达计划在下月GTC开发者大会上发布一款整合了Groq LPU技术的全新推理芯片,标志着公司正加速向推理计算领域转型,以应对市场对高效能、低成本计算方案的需求,并试图在AI产业下一阶段巩固其市场地位 [1][5] 产品与技术发布 - 英伟达计划在GTC大会上发布一款被其首席执行官称为“世界从未见过”的全新系统,专为加速AI模型的查询响应而设计 [1] - 新产品整合了Groq的“语言处理单元”(LPU)技术,该技术采用了与传统GPU截然不同的架构,在处理推理功能时表现出极高的效率 [1][2] - 即将发布的新品可能涉及具备颠覆性的下一代Feynman架构,该架构可能采用更广泛的SRAM集成方案,甚至通过3D堆叠技术将LPU深度整合,专门针对延迟和内存带宽进行优化 [2] 战略转型与市场布局 - 英伟达正在突破对传统图形处理器(GPU)的单一依赖,通过引入LPU新架构以及探索纯中央处理器(CPU)的部署模式来巩固市场地位 [1] - 公司正从单纯的芯片供应商向涵盖半导体、数据中心、云和应用的完整AI生态系统构建者转型 [5] - 公司本月宣布扩大与Meta Platforms的合作,进行了首次大规模的纯CPU部署,以支持Meta的广告定向AI智能体,这表明公司正超越单一的GPU销售模式 [3] 客户与市场需求 - ChatGPT开发商OpenAI已同意成为该新处理器的最大客户之一,并宣布将向英伟达购买大规模的“专用推理产能” [1] - 底层硬件设计的演进直接源于科技行业对AI代理应用需求的爆发,许多公司发现传统的GPU成本昂贵且在实际运行模型时并非最佳选择 [4] - OpenAI除了采购英伟达新系统,上个月还与初创公司Cerebras达成了一项价值数十亿美元的计算合作,并签署了使用亚马逊Trainium芯片的重大协议 [4] 行业竞争态势 - 英伟达面临谷歌、亚马逊以及众多初创公司的激烈竞争 [1] - 主要云服务商在加紧自研芯片,例如Anthropic Claude Code主要依赖亚马逊AWS和Alphabet旗下谷歌云设计的芯片,而非英伟达的产品 [5] - Cerebras首席执行官称,其专注于推理的芯片在速度上超越了英伟达的GPU [4] 技术整合与收购 - 英伟达去年底斥资200亿美元获得了初创公司Groq的关键技术许可,并在一场大规模的“核心聘用”交易中吸纳了包括创始人Jonathan Ross在内的高管团队 [2]

Nvidia-报道:英伟达在下月GTC大会推出“新推理芯片”,融入Groq LPU设计 - Reportify