Groq LPX
搜索文档
英伟达、阿里重估AI,把FLOPS“扔进垃圾堆”
36氪· 2026-03-18 17:08
文章核心观点 - 英伟达GTC 2026发布会的核心并非单一芯片性能,而是提出了“每瓦Token数”作为衡量AI工厂产出的新核心度量衡,这标志着行业竞争焦点正从芯片峰值参数转向系统级端到端能效,即在固定的能源约束下最大化智能产出 [1][2][4] - 行业对AI基础设施的认知正经历从“芯片中心主义”到“计算系统中心主义”的转变,竞争叙事边界已扩展至由计算、网络、存储、电力、冷却等共同构成的完整AI工厂系统 [4][11] - “每瓦Token数”这一度量单位的价值在于,它将电力输入到智能产出的完整链条连接起来,使行业能更直接地评估AI系统将能源转化为有效业务产出的效率,这比传统的部件层指标更具现实指导意义 [9][10] GTC 2026的核心变化与产业深意 - 发布会最值得重视的变化不在芯片本身,而是将算力竞争的叙事边界从单颗芯片推进到了算力基础设施级别,即完整的AI工厂系统 [4] - 英伟达展示的新产品如Vera Rubin、DSX AI Factory等,均强调其作为POD级平台或参考设计,目标是最大化每瓦Token数,体现了系统级竞争的思路 [4] - 这背后是一次“智能度量语言”的迁移,从衡量部件能力的芯片层指标,转向衡量整体产出的系统层指标,其打开的产业视角比任何单一新芯片都更值得深入讨论 [2][8] 度量体系的演进:从芯片到系统 - 芯片时代的度量体系关注峰值算力、显存带宽、FLOPS/W等部件能力边界指标 [6] - 当前智算中心缺乏客观、统一、通用的度量单位,使用兆瓦或基于FP16的PFlops等单位,但相同算力或电力的集群因内部组件不同,效能差异巨大 [7] - 系统层更合理的度量应是“每瓦Token数”,因为它能回答在固定功率、散热、机房约束下,AI系统能产出多少有效的AI结果,对应系统最优而非局部最优 [7][8] - 阿里巴巴在GTC前一天宣布成立“Alibaba Token Hub”,由CEO吴泳铭挂帅,将Token提升至公司AI战略高度,同样体现了行业向系统视角和以Token为核心度量转变的趋势 [2] Token/W 作为新度量衡的价值与影响 - Token被英伟达称为现代AI的基本单位,因其与模型推理过程、收入模型直接耦合,并能有效覆盖推理时代的新负载 [9] - AI基础设施的底层约束日益体现为能源约束,国际能源署报告预计到2030年全球数据中心用电将增长到约945TWh,AI是主要驱动因素之一,许多问题实质上是电力、散热和基础设施组织问题 [9] - Token/W的概念将电力输入,经过计算、网络、存储、调度和冷却,最终转化为Token产出的链条连接起来,衡量的是AI系统将多少能源转化成了多少智能产出 [10] - 产业进入大规模部署阶段后,决定胜负的往往是系统组织能力,而非部件参数,AI基础设施已到达此阶段 [11] 系统视角下光互连与光计算的产业地位提升 - 当度量体系迁移到系统层,过去被视为配套的环节如光互连的重要性会显著上升 [12] - 在Token/W框架下,光互连的价值在于降低数据搬运的能量代价,提升大规模AI计算系统将电力转化为Token的能力,英伟达基于光子的CPO相比光模块可实现最高5倍能效 [12] - 随着模型和集群规模扩大,系统能耗越来越多地发生在跨芯片、跨机柜的数据搬运上,提高Token/W不能只靠更强GPU,还需要更高效的互连,光互连正成为大规模AI系统的必要节能手段 [13][14] - 更前沿的光计算,其产业意义在系统层也更容易讲清,它不要求替代整个GPU,而是旨在通过在某些关键工作负载上降低能量消耗,从而提高系统层的Token产出效率 [15] - 当算力竞争迁移到AI大规模系统级基础设施,光互连与光计算因能解决数据搬运和高密度计算的单位能耗问题,从而从先进技术选项走向产业基础设施主线 [16][17] 对AI产业发展的整体启示 - AI基础设施正在变成一个用能源来衡量的系统工程,未来面临的约束包括电网接入、机房散热、园区能耗、机柜功率密度和投产速度等 [17] - 英伟达GTC 2026以及行业巨头的动向表明,需从系统思维的视角看待AI产业发展,关注芯片在网络中的协同、在机架中的部署、在园区的电力获取及最终的业务端产出 [10][18] - 这一转变与人类文明发展的主轴一致,即用更低的能量采集、传输和处理更多的信息,AGI的推进也将遵循这一逻辑 [18][19]
英伟达-GTC 大会-金融分析师问答要点
2026-03-18 10:29
涉及的公司与行业 * 公司:英伟达公司 [1] * 行业:人工智能、半导体、数据中心、IT软件 [4][5] 核心观点与论据 * **投资评级与目标价**:花旗维持对英伟达的“买入”评级,目标股价为300美元,基于2027财年预期每股收益10美元(包含股权激励)的约30倍市盈率,该倍数与其3年平均水平一致 [2][6] * **AI发展拐点**:公司强调智能体AI是继生成式AI和推理之后的第三大AI拐点,OpenClaw被定位为个人AI计算机的操作系统,管理资源、调度、I/O和网络,公司认为每家公司都需要一个OpenClaw战略 [4] * **数据中心销售能见度**:公司对Blackwell和Rubin系统截至2027年底的营收能见度超过1万亿美元,高于去年引用的5000亿美元,这反映了对需求和采购订单的高度信心,且不包括Groq、独立CPU、Rubin Ultra等新产品,管理层强调这是一个“底线” [4] * **推理业务领导力**:2025年是公司证明其在AI推理领域领导地位的一年,尽管系统平均售价更高,但由于卓越的吞吐量和能效,英伟达的系统能提供最低的令牌成本,每一代新产品都提升了每秒令牌数和每瓦每秒令牌数,这巩固了利润率并推动了快速的客户升级周期 [4] * **客户构成**:大约60%的营收来自超大规模云服务商,但公司强调其也是云服务商的客户获取引擎,将CUDA开发者和AI原生公司带入他们的云,剩余的40%(企业、本地部署、工业、区域云)没有英伟达的全栈平台则无法服务,目前双方增长相似,但物理AI预计将随时间改变这一构成,因为物理AI相关的世界远大于数字AI,因此40%的份额有望变为70% [4] * **Groq LPX定位**:Groq LPX被定位为GPU的补充而非替代,Vera Rubin覆盖了大部分推理层级(从“免费”到“更好”),而Groq则针对“最佳”和“极致”层级,特别是自回归推理中最终对延迟敏感的阶段,公司预计Groq将适用于约25%的大型客户子集的工作负载,通过启用更高价格的令牌层级,可能使该细分市场的营收机会翻倍 [4] * **共封装光学技术路线**:公司计划尽可能长时间地使用铜进行扩展,原因是可制造性、可靠性和成本,近期系统仍100%使用铜,下一代系统将提供铜和铜+CPO选项,再下一代(如NVL1152)将全部采用CPO并实现非常大的规模扩展,但总体铜用量由于机架数量、以太网横向扩展和存储连接性的增加而持续增长,这是一个过渡而非取代 [4] * **供应链准备**:管理层承认全球需求正在快速增长,但强调英伟达的供应链在多个维度(芯片、电源、冷却、光学、线缆、劳动力)是平衡且有保障的,长期的供应商合作伙伴关系、预付款和产能投资使公司能够满足超过1万亿美元的需求前景,同时为额外的上行空间保持灵活性 [5] * **对IT软件行业的影响**:公司认为2万亿美元的IT软件行业将通过集成AI智能体转变为一个更大的市场(约8万亿美元),传统的软件许可商业模式将转向生成和租赁令牌,IT供应商将把OpenAI、Anthropic和开源模型嵌入到特定领域、受治理的解决方案中,毛利率结构可能因引入销货成本而改变,但总价值和营收机会将显著扩大 [5] * **现金使用**:资本优先事项是:1)为增长提供资金 2)投资生态系统 3)履行去年的承诺 4)向股东返还资本,管理层表示起点是将约50%的自由现金流分配给股息和股票回购,随着承诺完成以及“1万亿美元以上”中的“以上”部分实现,返还比例有上行空间 [5] 其他重要内容 * **风险提示**:实现目标股价的下行风险包括:1)游戏领域的竞争可能导致公司失去市场份额并拖累股价 2)新平台采用速度慢于预期可能导致数据中心和游戏销售下降 3)汽车和数据中心市场的波动性可能增加股价/估值的波动 4)加密货币挖矿对游戏销售的影响 [7] * **利益披露**:花旗全球市场公司或其关联公司在过去12个月内曾因向英伟达公司提供投资银行服务而获得报酬,并存在其他商业关系 [11][12][13]
从GPU到LPU:英伟达大举进攻推理芯片,黄仁勋再落关键一子
华夏时报· 2026-03-18 08:59
行业趋势:AI算力需求从训练转向推理 - AI产业风向转变,从过去几年专注于“训练模型”转向“推理”成为主流,智能体(如Manus、OpenClaw)涌向市场,模型厂商和云服务商开始靠卖token赚钱 [1] - 业界意识到,随着AI能力从基础大模型训练向构建工作流的智能体演进,AI算力需求重心已从训练转向推理,智能体核心场景更侧重于推理 [5][6] - 竞争轴心发生偏移,模型参数比拼进入边际效应递减瓶颈期,大模型训练在狂奔两年后慢下来,2025年开始智能体与上下文工程站上核心位置 [5] 公司战略:英伟达推出LPU并升级生态 - 英伟达在GTC 2026上正式推出新武器Groq 3 LPU(语言处理单元),大举进攻AI推理芯片市场 [1] - 推出LPU是应对AI算力需求从“训练”转向“推理”的战略性布局,旨在补齐短板,用更精细化的产品布局回应市场变化和竞争对手挑战 [3] - 公司进行整个生态层面的升级,不仅推出LPU,还联合OpenClaw创始人等团队推出NeMoClaw参考架构,并推出Vera Rubin DSX AI工厂参考设计,教客户如何设计、建设和运营整个AI工厂基础设施堆栈 [6] 产品与技术:Vera Rubin平台与性能提升 - 英伟达正式推出Vera Rubin平台,共搭载7款芯片,包括Rubin GPU、Vera CPU及新集成的Groq 3 LPU等 [2] - Rubin GPU结合Groq LPU,计划将AI模型token吞吐量从当下每秒100个推向每秒1500个甚至更多,以完美支撑AI智能体交互场景 [2] - 推出专用于容纳新型Groq加速器的完整机架Groq LPX,据称将提升“每个令牌上AI模型每一层”的解码性能,并使平台能够服务于需要推理数万亿参数模型的多智能体系统 [2] 市场与竞争:市场格局变化与对手 - 根据高盛全球投资研究部模型预测,在AI服务器的AI芯片中,非GPGPU芯片(如ASIC)的出货占比将从2024年的36%增长至2027年的45%,而GPGPU芯片占比将从2024年的64%下降至2027年的55% [3] - GPU在基座大模型训练、通用性要求更高的场景(如公有云)和并行计算场景更有竞争力,而ASIC(包括TPU、DPU、NPU、LPU等)在模型部署和推理场景下,因对能效比、响应延迟要求更高而相对更有优势 [3] - 在ASIC市场,英伟达的对手包括国外的Cerebras,以及中国的寒武纪、华为、燧原科技等,英伟达进军推理芯片领域对国内厂商而言既是挑战也是催化剂,可能加速行业洗牌和技术升级 [7] 财务与业务:收入预测与市场进展 - 英伟达CEO黄仁勋在GTC 2026上表示,到2027年底,Blackwell和Rubin两条产品线的年收入将达1万亿美元,比半年前的预测翻了一倍 [1] - 英伟达为应对推理需求所做的计划已带来回报,OpenAI上月表示已与英伟达达成协议,将采购具有“专用推理能力”的芯片 [4] - 英伟达在2025年12月以约200亿美元的价格收购了Groq的核心技术资产,Groq 3 LPU是收购后首个公开成果 [3] 专家观点与未来展望 - 专家认为,英伟达进军推理芯片市场,并不意味着其GPU业务会因此受损,反而会在与LPU的协同中迎来更广阔的市场空间 [7] - 专家指出,短期内GPU凭借强大的场景适应性和生态壁垒主导市场(尤其在AI训练场景),长远看GPU与专用芯片将走向融合与市场分层,硬件上GPU会集成更强的专用核心,专用芯片也会增加可编程性 [7] - 预计市场将形成GPU主导创新与通用平台、专用芯片深耕规模化推理的分层格局 [7]
「AI新世代」从GPU到LPU:英伟达大举进攻推理芯片,黄仁勋再落关键一子
华夏时报· 2026-03-17 20:44
文章核心观点 - AI产业重心正从模型训练转向模型推理,英伟达通过推出Groq 3 LPU专用推理芯片及Vera Rubin平台,战略性布局并大举进攻推理芯片市场,以巩固其AI基础设施领导地位 [1][3][6] 产品发布与性能 - 英伟达在GTC 2026上正式推出Vera Rubin平台,该平台共搭载7款芯片,包括Rubin GPU、Vera CPU及新集成的Groq 3 LPU [2] - Groq 3 LPU是一款专用的AI推理加速芯片,全称为“语言处理单元”,结合Rubin GPU,可将AI模型推理的吞吐量从每秒100个token提升至每秒1500个token甚至更多 [2] - 公司同时推出了专用于容纳Groq加速器的完整机架Groq LPX,旨在提升每个令牌上AI模型每一层的解码性能,以服务于需要处理数万亿参数模型和百万级token上下文窗口的多智能体系统 [2] 市场战略与布局 - 英伟达对推理市场的布局早有准备,于2025年12月以约200亿美元的价格收购了Groq的核心技术资产,Groq 3 LPU是收购后的首个公开成果 [3] - 推出LPU是应对AI算力需求从“训练”转向“推理”的战略性布局,旨在用更精细化的产品回应市场变化和竞争挑战 [3] - 公司预测,到2027年底,其Blackwell和Rubin两条产品线的年收入将达到1万亿美元,这比半年前的预测翻了一倍 [1] 行业趋势与需求变化 - AI产业风向已变,智能体的普及推动市场需求从模型训练转向模型推理,因为智能体的核心场景更侧重于推理 [1][6] - 据高盛模型预测,在AI服务器的AI芯片中,非GPGPU芯片(如ASIC)的出货占比将从2024年的36%增长至2027年的45%,而GPGPU芯片的占比将从64%下降至55% [3] - 分析师指出,GPU在基座大模型训练、公有云等通用性要求高的场景更有竞争力,而ASIC在模型部署和推理场景下,因对能效比和延迟要求更高而更具优势 [3] 生态系统升级 - 英伟达的布局不仅是芯片,更是整个生态层面的升级,公司推出了Vera Rubin DSX AI工厂参考设计,指导如何设计、建设和运营整个AI工厂基础设施堆栈 [7] - 公司联合OpenClaw创始人等团队推出了NeMoClaw参考架构,内置安全技术,旨在让企业在私有环境中安全运行智能体系统 [6] - 黄仁勋表示,在AI时代,智能token是新的货币,而AI工厂是生成这些token的基础设施 [7] 竞争格局与行业影响 - 在ASIC推理芯片市场,英伟达已面临一批竞争对手,包括国外的Cerebras以及中国的寒武纪、华为、燧原科技等 [8] - 专家认为,英伟达进军推理芯片领域,对国内厂商而言既是挑战也是催化剂,将加速行业洗牌和技术升级 [8] - 短期内GPU凭借场景适应性和生态壁垒仍将主导市场(尤其在训练场景),长远看GPU与专用芯片将走向融合与市场分层 [8] 市场反馈与客户 - 英伟达应对推理需求的计划已带来回报,OpenAI上月已与英伟达达成协议,将采购具有“专用推理能力”的芯片 [4]