Groq 3 LPU芯片
搜索文档
黄仁勋详解英伟达的AI时代新叙事
中国经营报· 2026-03-18 22:20
GTC 2026 核心发布与战略方向 - 英伟达GTC 2026大会发布多项重磅产品与技术,包括3nm制程的Vera Rubin AI加速平台、集成Groq LPU推理芯片、推出NemoClaw、进军太空计算服务等 [2] - 公司创始人兼CEO黄仁勋在演讲中强调,今年恰逢CUDA推出20周年,其庞大安装量引发的飞轮效应是公司AI算力的核心护城河 [2] - 行业观察指出,英伟达近两年在底层CUDA之上积极开发自身开源大模型,并正从“GPU供应商”彻底转型为“全栈AI基础设施提供商” [2][3] Vera Rubin 平台与 Groq LPU 集成 - Vera Rubin平台已全面投产,正式交付预计在2026年下半年,Blackwell与Rubin架构的综合采购订单预计在2027年前达到1万亿美元规模 [3] - 平台由新一代Vera CPU、Rubin GPU、NVLink 6交换机、ConnectX-9超级网卡、BlueField-4 DPU、Spectrum-6以太网交换机及新集成的Groq 3 LPU共7类芯片协同设计而成,涵盖计算、网络和存储功能 [4] - Groq 3 LPU定位为Rubin GPU的“推理协处理器”,源自公司2025年12月以200亿美元协议收购Groq公司的技术授权,由三星代工并于2026年第三季度出货 [2][5] - 公司通过Dynamo软件系统进行任务分工:将“预填充”阶段交给Vera Rubin处理高吞吐量任务,将对延迟敏感的“解码”阶段交给Groq LPU,官方数据显示每兆瓦功耗的推理吞吐量最高可提升35倍,万亿参数模型的收益机会最高可提升10倍 [5] - Groq LPU大约能覆盖25%的工作负载,主要涉及大量编码或高价值工程级token生成,其余75%由Vera Rubin负责,且集成无需修改现有CUDA软件生态系统 [5][6] 市场影响与竞争格局 - 摩根士丹利研报称,Groq LPU与Vera Rubin的协同设计为AI推理建立了“英伟达标准”,预计到2028年全球AI推理市场规模将达6500亿美元,占AI芯片总市场的70%以上 [3] - 通过结合Rubin GPU和Groq LPU,公司进入了此前由Cerebras、SambaNova等专用推理芯片公司占据的低延迟推理市场,收购Groq技术是对竞争者的直接回应 [6] - Groq 3 LPU的加入可能降低公司此前专为超长上下文推理设计的Rubin CPX GPU的作用,因为LPU无需CPX所需的大量GDDR7内存 [7] 进军CPU直销与系统级扩展 - 公司推出为智能体AI工作负载定制的Vera CPU,这是全球唯一支持LPDDR5的数据中心CPU,并已开始单独销售,有望成为一项数十亿美元级业务,标志着正式进军CPU直销领域 [8][9] - Vera CPU配合BlueField-4 DPU和CX-9 SuperNIC,能够为智能体系统提供工具使用能力,满足智能体调用工具、访问文件系统等需求 [8] - 公司已与Meta达成多年期战略合作,Meta将部署全球首个大规模独立Grace CPU集群 [9] 技术路线图与未来架构 - 展示了Rubin平台的高性能版本Rubin Ultra,采用垂直插入的Kyber机架设计,每个机架能连接144个GPU形成一个NVLink域,芯片即将流片 [10] - 公布了下一代计算架构Feynman,将首次实现铜线与CPO(共封装光学)的共同部署 [10] - 发布了Space-1 Vera Rubin模块,标志着公司正式推出太空计算服务,该模块专为在太空轨道数据中心直接运行LLM和高级基础模型而设计 [10] - 硬件分工从PD分离进一步演化为AFD,即将注意力模块和前馈网络模块部署在不同设备上,以进一步优化资源利用率和推理效率 [10][11] 软件、生态与全栈协同优势 - 黄仁勋提出“AI五层蛋糕理论”,并强调除了芯片层,公司正积极参与上层设计 [12][14] - 盛赞开源项目OpenClaw为“人类历史上最受欢迎的开源项目”之一,重要性堪比Linux和HTML,并推出与之结合的NemoClaw开源项目,定位为“智能体计算机的操作系统” [12] - 推出了包含安全组件OpenShell的NemoClaw参考架构,为企业级应用提供数据隐私和安全保障 [12] - 介绍了六大系列开源模型的最新进展并开放相关资源,包括Nemotron、Cosmos World Foundation Model、Project GR00T、Drive AV Foundation Models、BioNeMo以及Earth-2,以推动整个AI生态发展 [13] - 在自动驾驶领域,宣布“自动驾驶的ChatGPT时刻已经到来”,车辆已具备解释驾驶决策并执行语音指令的推理能力;在机器人领域,正与ABB、Universal Robots、KUKA等企业合作,将物理AI模型与仿真系统结合 [13] - 行业分析认为,公司“硬件+软件+生态”的全栈协同优势短期内无竞争对手可撼动,Vera CPU的独立商业化与OpenClaw的开源策略分别从硬件垂直整合与软件生态开放两个维度巩固了行业地位 [15]
黄仁勋:“信心十足”
财联社· 2026-03-18 09:14
公司战略与财务目标 - 英伟达创始人兼首席执行官黄仁勋确认,到2027年底,公司新一代AI加速芯片将至少创收1万亿美元,且此目标未涵盖公司其他产品线,意味着总收入将超过1万亿美元 [3][6] - 公司先前预计到2026年底数据中心设备销售额将达到5000亿美元,最新预测将时间延长一年至2027年底,使累计规模翻倍 [8] - 公司首席财务官表示,在完成既定投资后,计划将约50%的自由现金流用于股东回报,包括股票回购和分红,并预计在今年下半年实施 [9][10] 产品与技术布局 - 黄仁勋展示了新一代AI计算平台Vera Rubin、Groq 3 LPU(语言处理单元)芯片、CPO交换机与太空数据中心模块,并推出NemoClaw智能体基础设施 [5] - 公司正试图构建从边缘、数据中心到轨道计算的全栈AI生态 [5] 市场需求与供应 - 黄仁勋表示,需求正以非常大的规模加速增长,公司能够通过供应来支持这一需求 [7] - 尽管收入规模远超潜在竞争对手,但华尔街分析师担心这一预测并未显示公司的营收增长正在加速 [7]
英伟达预计到2027年底AI芯片收入将达到至少1万亿美元
新浪财经· 2026-03-17 05:35
公司业绩与市场展望 - 公司预计到2027年底,其Blackwell和Rubin芯片将至少创造1万亿美元收入 [1][5] - 公司此前预计到2026年底,这些芯片将带来5000亿美元销售额,最新预测将展望期延长了一年 [1][5] - 该预测凸显了公司业务规模之大,但累计数字并不意味着销售增长将大幅加速 [1][5] - 公司首席执行官表示,过去两年里,计算需求增长了100万倍 [3][7] 产品发布与技术拓展 - 公司在GTC大会上发布新产品,将增加一款采用从初创公司Groq收购技术制造的芯片,该芯片将提升人工智能系统的响应速度 [3][7] - 公司宣布将Groq 3 LPU(语言处理单元)纳入产品目录,这是一种专门用于加速大语言模型推理的芯片 [4][8] - 该LPU芯片集成了高速内存,有助于几乎即时生成文本,公司将把它作为协处理器以辅助加速器的工作 [5][8] - 公司展示了一款采用通用目的CPU的计算机,标志着其进一步扩展至由英特尔开创的技术领域 [3][7] - 公司首席执行官表示,CPU机会“肯定”是一项价值数以十亿美元的业务 [3][7] 行业竞争与市场地位 - 对人工智能芯片的大规模支出已将公司推升为全球市值最高的公司 [3][7] - 公司面临来自Advanced Micro Devices Inc.等竞争对手日益加剧的挑战 [3][7] - 公司自身客户也在尝试自研芯片来处理人工智能任务 [3][7] - 投资者一直在寻求更多证据,以证明市场增长势头依然强劲 [3][7] 公司战略与活动 - 此次GTC发布会是公司推动人工智能计算并维持客户对其技术忠诚度的最新行动 [3][7] - 公司利用GTC活动宣布与多个行业的企业建立合作关系,旨在展示人工智能日益增长的益处 [3][7]