Vera Rubin DSX AI工厂参考设计
搜索文档
英伟达、Emerald AI联手六大电力巨头共推“算电协同” 打造新一代AI工厂
智通财经· 2026-03-23 21:13
合作联盟与核心目标 - 英伟达与Emerald AI联合美国六家主要电力公司(AES发电、Constellation Energy、Invenergy、新纪元能源、Nscale Energy & Power、Vistra)共同推进新一代AI工厂建设 [1] - 合作旨在构建AI的未来,实现AI工厂的性能、效率与电网响应能力的即时协同 [1] - 合作企业承诺积极建设发电能力,以确保供应能满足日益增长的电力需求 [2] AI工厂的技术与设计 - 新一代AI工厂将采用英伟达Vera Rubin DSX AI工厂参考设计,该设计包含DSX Flex软件库,可实现AI工厂与电网服务的高效对接 [1] - AI工厂的建设将基于英伟达与Emerald AI联合开发的架构 [2] - Emerald AI的Conductor平台将统筹算力灵活性,整合现场发电、储能及其他用户侧资源,实现精准响应电网需求的电力调度 [1] 运营模式与电网价值 - AI工厂将作为灵活的能源资产,不仅能够更快接入电网,还能为电网提供支撑 [1] - 采用混合型AI工厂模式:初期利用就近布置的发电与储能设施作为过渡电源,后续通过灵活调度这些资源为电网供电 [1] - 此模式有助于加快AI算力的上线速度,并加快AI工厂的并网进程,同时为更广泛的电力系统提供支持 [1] - 合作各方将联合评估针对AI工厂的优化发电方案,并探索采用就近供电的混合项目模式,以缩短通电周期,为电网创造更大价值 [2]
英伟达(NVDA.US)、Emerald AI联手六大电力巨头共推“算电协同” 打造新一代AI工厂
智通财经网· 2026-03-23 20:44
核心观点 - 英伟达与Emerald AI联合多家美国电力公司共同推进新一代AI工厂建设 旨在通过创新的混合项目模式与电网服务设计 加快AI算力上线速度 并为电网提供灵活支撑 [1] - 合作模式将利用就近布置的发电与储能设施作为过渡电源 后续可灵活调度这些资源为电网供电 从而加速AI工厂并网进程 [1] 合作方与架构 - 合作方包括英伟达、Emerald AI及美国电力公司AES发电、Constellation Energy、Invenergy、新纪元能源、Nscale Energy & Power、Vistra [1] - 新一代AI工厂将采用英伟达Vera Rubin DSX AI工厂参考设计 该设计包含DSX Flex软件库 可实现AI工厂与电网服务的高效对接 [1] - Emerald AI的Conductor平台将统筹算力灵活性 整合现场发电、储能及其他用户侧资源 实现精准响应电网需求的电力调度 [1] 商业模式与目标 - AI工厂在初期可利用就近布置的发电与储能设施作为过渡电源 形成混合型AI工厂 [1] - 后续通过灵活调度这些资源为电网供电 以加快AI工厂的并网进程 同时为更广泛的电力系统提供支撑 [1] - 该模式旨在加快AI算力的上线速度 为客户与社区创造更多价值 [1] - 多家电力公司承诺积极建设发电能力 确保供应满足日益增长的电力需求 [2] - 各方将联合评估针对AI工厂的优化发电方案 并探索采用就近供电的混合项目模式 以缩短通电周期 为电网创造更大价值 [2]
从GPU到LPU:英伟达大举进攻推理芯片,黄仁勋再落关键一子
华夏时报· 2026-03-18 08:59
行业趋势:AI算力需求从训练转向推理 - AI产业风向转变,从过去几年专注于“训练模型”转向“推理”成为主流,智能体(如Manus、OpenClaw)涌向市场,模型厂商和云服务商开始靠卖token赚钱 [1] - 业界意识到,随着AI能力从基础大模型训练向构建工作流的智能体演进,AI算力需求重心已从训练转向推理,智能体核心场景更侧重于推理 [5][6] - 竞争轴心发生偏移,模型参数比拼进入边际效应递减瓶颈期,大模型训练在狂奔两年后慢下来,2025年开始智能体与上下文工程站上核心位置 [5] 公司战略:英伟达推出LPU并升级生态 - 英伟达在GTC 2026上正式推出新武器Groq 3 LPU(语言处理单元),大举进攻AI推理芯片市场 [1] - 推出LPU是应对AI算力需求从“训练”转向“推理”的战略性布局,旨在补齐短板,用更精细化的产品布局回应市场变化和竞争对手挑战 [3] - 公司进行整个生态层面的升级,不仅推出LPU,还联合OpenClaw创始人等团队推出NeMoClaw参考架构,并推出Vera Rubin DSX AI工厂参考设计,教客户如何设计、建设和运营整个AI工厂基础设施堆栈 [6] 产品与技术:Vera Rubin平台与性能提升 - 英伟达正式推出Vera Rubin平台,共搭载7款芯片,包括Rubin GPU、Vera CPU及新集成的Groq 3 LPU等 [2] - Rubin GPU结合Groq LPU,计划将AI模型token吞吐量从当下每秒100个推向每秒1500个甚至更多,以完美支撑AI智能体交互场景 [2] - 推出专用于容纳新型Groq加速器的完整机架Groq LPX,据称将提升“每个令牌上AI模型每一层”的解码性能,并使平台能够服务于需要推理数万亿参数模型的多智能体系统 [2] 市场与竞争:市场格局变化与对手 - 根据高盛全球投资研究部模型预测,在AI服务器的AI芯片中,非GPGPU芯片(如ASIC)的出货占比将从2024年的36%增长至2027年的45%,而GPGPU芯片占比将从2024年的64%下降至2027年的55% [3] - GPU在基座大模型训练、通用性要求更高的场景(如公有云)和并行计算场景更有竞争力,而ASIC(包括TPU、DPU、NPU、LPU等)在模型部署和推理场景下,因对能效比、响应延迟要求更高而相对更有优势 [3] - 在ASIC市场,英伟达的对手包括国外的Cerebras,以及中国的寒武纪、华为、燧原科技等,英伟达进军推理芯片领域对国内厂商而言既是挑战也是催化剂,可能加速行业洗牌和技术升级 [7] 财务与业务:收入预测与市场进展 - 英伟达CEO黄仁勋在GTC 2026上表示,到2027年底,Blackwell和Rubin两条产品线的年收入将达1万亿美元,比半年前的预测翻了一倍 [1] - 英伟达为应对推理需求所做的计划已带来回报,OpenAI上月表示已与英伟达达成协议,将采购具有“专用推理能力”的芯片 [4] - 英伟达在2025年12月以约200亿美元的价格收购了Groq的核心技术资产,Groq 3 LPU是收购后首个公开成果 [3] 专家观点与未来展望 - 专家认为,英伟达进军推理芯片市场,并不意味着其GPU业务会因此受损,反而会在与LPU的协同中迎来更广阔的市场空间 [7] - 专家指出,短期内GPU凭借强大的场景适应性和生态壁垒主导市场(尤其在AI训练场景),长远看GPU与专用芯片将走向融合与市场分层,硬件上GPU会集成更强的专用核心,专用芯片也会增加可编程性 [7] - 预计市场将形成GPU主导创新与通用平台、专用芯片深耕规模化推理的分层格局 [7]
「AI新世代」从GPU到LPU:英伟达大举进攻推理芯片,黄仁勋再落关键一子
华夏时报· 2026-03-17 20:44
文章核心观点 - AI产业重心正从模型训练转向模型推理,英伟达通过推出Groq 3 LPU专用推理芯片及Vera Rubin平台,战略性布局并大举进攻推理芯片市场,以巩固其AI基础设施领导地位 [1][3][6] 产品发布与性能 - 英伟达在GTC 2026上正式推出Vera Rubin平台,该平台共搭载7款芯片,包括Rubin GPU、Vera CPU及新集成的Groq 3 LPU [2] - Groq 3 LPU是一款专用的AI推理加速芯片,全称为“语言处理单元”,结合Rubin GPU,可将AI模型推理的吞吐量从每秒100个token提升至每秒1500个token甚至更多 [2] - 公司同时推出了专用于容纳Groq加速器的完整机架Groq LPX,旨在提升每个令牌上AI模型每一层的解码性能,以服务于需要处理数万亿参数模型和百万级token上下文窗口的多智能体系统 [2] 市场战略与布局 - 英伟达对推理市场的布局早有准备,于2025年12月以约200亿美元的价格收购了Groq的核心技术资产,Groq 3 LPU是收购后的首个公开成果 [3] - 推出LPU是应对AI算力需求从“训练”转向“推理”的战略性布局,旨在用更精细化的产品回应市场变化和竞争挑战 [3] - 公司预测,到2027年底,其Blackwell和Rubin两条产品线的年收入将达到1万亿美元,这比半年前的预测翻了一倍 [1] 行业趋势与需求变化 - AI产业风向已变,智能体的普及推动市场需求从模型训练转向模型推理,因为智能体的核心场景更侧重于推理 [1][6] - 据高盛模型预测,在AI服务器的AI芯片中,非GPGPU芯片(如ASIC)的出货占比将从2024年的36%增长至2027年的45%,而GPGPU芯片的占比将从64%下降至55% [3] - 分析师指出,GPU在基座大模型训练、公有云等通用性要求高的场景更有竞争力,而ASIC在模型部署和推理场景下,因对能效比和延迟要求更高而更具优势 [3] 生态系统升级 - 英伟达的布局不仅是芯片,更是整个生态层面的升级,公司推出了Vera Rubin DSX AI工厂参考设计,指导如何设计、建设和运营整个AI工厂基础设施堆栈 [7] - 公司联合OpenClaw创始人等团队推出了NeMoClaw参考架构,内置安全技术,旨在让企业在私有环境中安全运行智能体系统 [6] - 黄仁勋表示,在AI时代,智能token是新的货币,而AI工厂是生成这些token的基础设施 [7] 竞争格局与行业影响 - 在ASIC推理芯片市场,英伟达已面临一批竞争对手,包括国外的Cerebras以及中国的寒武纪、华为、燧原科技等 [8] - 专家认为,英伟达进军推理芯片领域,对国内厂商而言既是挑战也是催化剂,将加速行业洗牌和技术升级 [8] - 短期内GPU凭借场景适应性和生态壁垒仍将主导市场(尤其在训练场景),长远看GPU与专用芯片将走向融合与市场分层 [8] 市场反馈与客户 - 英伟达应对推理需求的计划已带来回报,OpenAI上月已与英伟达达成协议,将采购具有“专用推理能力”的芯片 [4]