英伟达GTC大会前瞻:整合Groq技术大举进攻推理芯片,三星首度代工生产,OpenAI或成首批客户

英伟达GTC大会核心观点 - 英伟达年度GTC开发者大会被视为AI产业重要风向标,本届大会将释放公司战略重心从训练向推理转变、供应链调整及扩展应用生态三大关键信号 [1] 战略重心转向AI推理市场 - AI产业正从“训练优先”转向“推理驱动”,英伟达在训练领域优势稳固,但在推理市场面临Cerebras等竞争者以更高速度、更低成本方案的挑战 [2] - 公司预计将宣布融合英伟达与Groq技术的新型芯片系统,以切入AI推理市场,该系统是英伟达首次将另一家公司的AI处理器(Groq LPU)直接整合进其服务器机架体系 [2] - 为获得Groq的LPU技术,英伟达在去年底斥资约200亿美元 [2] 供应链布局调整 - 新的Groq LPU芯片预计将在2024年下半年由三星代工生产,这可能是英伟达服务器芯片首次由台积电以外的代工厂制造 [3] - 这一供应链变化或为阶段性安排,由于下一代LPU需与未来AI芯片更紧密整合,后续生产仍可能回归台积电 [3] - 在需求端,OpenAI预计将成为该新系统的首批客户之一,芯片系统可能用于驱动AI代理执行编码等任务 [3] 技术架构与整合路线 - 新系统架构与现有系统明显不同,每个机架将搭载256颗Groq芯片,并由Intel处理器负责通信管理,显示现有架构尚未与LPU完全融合 [4] - 公司有长远整合计划,内部正在探索将LPU更深层整合进未来产品路线图,其中一个方案是将Groq处理器与下一代Feynman GPU融合为单芯片,以提升性能并降低成本 [4] AI应用与生态扩展 - 随着“AI摩尔定律”(算力效率约每四个月翻倍)持续推进,公司在机器人和物理AI领域的布局备受关注,尤其是在中国人形机器人产业加速发展的背景下 [6] - 公司在开源模型领域快速推进,已发布1200亿参数的Nemotron 3 Super模型,并表示将推出参数规模扩大四倍的Nemotron 4 Ultra [6] - 模型能力的提升有望进一步降低企业AI推理成本,并改善整体投资回报率 [6] - 本届GTC释放的信号或将在很大程度上影响2026年AI产业格局 [6]