Workflow
Nvidia IGX Thor
icon
搜索文档
英伟达正式发布LPU,CPU重磅更新:GPU不再是GTC唯一主角
半导体行业观察· 2026-03-17 06:10
公司战略与市场前景 - 公司首席执行官预测人工智能热潮将在未来一年内产生价值1万亿美元的订单积压,是去年同期预测的两倍[1][5] - 公司首席执行官宣称正处于一个全新平台变革的开端,并重新定义了计算[5] - 首席执行官认为人工智能的发展仍处于起步阶段[4] - 首席执行官强调推理转折点已经到来,2026年将是推理能力主导人工智能的一年[50] - 公司被描述为“垂直整合但横向开放”,旨在向客户提供完整的技术栈[59] - 公司预告下一代Feynman系统,配备全新GPU、LPU、CPU等,预计2028年发布[60] 新产品发布:Rubin平台与Groq 3 LPU - 公司在GTC 2026上发布了多颗芯片和系统,以迎接市场机会[6] - Rubin平台新增Nvidia Groq 3 LPU,这是一款推理加速器,旨在增强系统以低延迟、大批量方式交付令牌的能力[7] - Groq 3 LPU集成了500 MB的SRAM,可提供150 TB/s的带宽,远高于HBM的22 TB/s[9] - 公司将构建包含256个Groq 3 LPU的Groq 3 LPX机架,提供128GB的SRAM和40 PB/s的推理加速带宽[11] - Groq LPX被设想为Rubin的协处理器,旨在提升解码性能,并服务于需要高交互性的多智能体系统[12] - 在多智能体系统中,Rubin GPU和Groq LPU的组合可将人工智能代理间通信的吞吐量从每秒100个token提升到每秒1500个token甚至更高[13] - Groq 3 LPU的推出旨在帮助公司在低延迟推理领域抵御Cerebras等挑战者,并可能导致Rubin CPX推理加速器的作用降低[15] 新产品发布:Vera CPU及机架系统 - 公司公布了全新88核Vera数据中心CPU的细节,声称其性能比标准CPU提升50%[16] - Vera CPU得益于Olympus核心IPC提升1.5倍,以及创新高带宽设计,提供最快的单线程性能[16] - 公司发布了Vera CPU机架架构,将256个液冷CPU集成到一个机架中,专为以CPU为中心的工作负载设计[16] - 该机架据称CPU吞吐量提升6倍,在智能AI工作负载中性能提升2倍[16] - Vera CPU的演进标志着公司正式进军CPU直销领域,成为英特尔和AMD的有力竞争对手[16] - 公司声称Vera CPU沙箱性能比x86竞争对手高出1.5倍,每个核心的内存带宽高出3倍,能效高出两倍[19] - Vera是一款88核144线程的CPU,采用公司设计的Arm v9.2-A Olympus核心,支持空间多线程技术[19][20] - 所有88个核心排列在一个域中,避免了NUMA架构的延迟问题[21] - Vera架构内存带宽达到1.2 TB/s,平均每个核心13.6 GB/s,单个核心最高支持80 GB/s吞吐量[22] - 芯片配备NVLink-C2C芯片间接口,吞吐量高达1.8 TB/s,是上一代Grace芯片的两倍[23] - Vera CPU机架包含256个液冷CPU、74个Bluefield-4 DPU和ConnectX SuperNIC网络,配备高达400 TB的LPDDR5内存,总内存吞吐量达300 TB/s[28] - 公司分享了基准测试结果,声称在各种工作负载下,其性能比Grace提高了1.8倍到2.2倍[29] - 公司将向Meta、Oracle、Coreweave、Nebius、阿里巴巴等超大规模数据中心运营商提供Vera CPU机架系统[30] - 众多OEM和ODM厂商将提供单路和双路服务器,Vera CPU也将用于Nvidia HGX NVL8系统[31] - Vera CPU目前已全面投产,预计将于今年下半年开始交付[32] 新产品发布:太空计算与边缘产品 - 公司发布了Vera Rubin太空模块,声称其在轨道推理工作负载方面的AI计算能力是H100的25倍[33] - 该模块专为在太空直接运行LLM和高级基础模型的轨道数据中心设计[34] - 已有六家商业航天公司部署了该平台[33] - 公司还面向任务关键型边缘环境推出Nvidia IGX Thor,面向卫星推出Jetson Orin[36] - 公司推出RTX PRO 6000 Blackwell系列服务器版GPU,声称在分析大型图像存档时,其性能比传统的基于CPU的批处理系统提升高达100倍[37] - 目前有六家公司正在轨道和地面环境中使用其平台[37] 公司业绩与市场挑战 - 公司凭借在人工智能芯片市场的主导地位,年收入从2022年的270亿美元增长到去年的2160亿美元,市值达到4.5万亿美元[42] - 自去年10月市值短暂突破5万亿美元大关以来,公司股价已经降温,原因是人们担心人工智能的热潮被过分夸大[43] - 尽管2月下旬发布的季度报告远超预期且管理层展望乐观,公司股价仍比数据公布前下跌了6%[45] - 分析师预计公司明年的收入将超过3300亿美元[46] - 公司在人工智能芯片市场正面临严峻挑战,因为谷歌和Meta等其他科技巨头试图开发自己的处理器[46] - 公司的潜在增长受到美国安全和贸易壁垒的制约,这些壁垒阻碍了其在中国销售先进芯片的能力[47] - 公司目前面临的挑战是其畅销产品在推理计算方面的吸引力不如在训练计算方面,用户反映其Grace Blackwell服务器能耗大且内存不足[51] - 有观点认为,由于推理计算商业模式重视效率和降低成本,且该领域竞争加剧,公司高达73%的毛利率必然会下降[52][53] - 为了帮助过渡到推理领域,公司与Groq达成了一项数十亿美元的授权协议,并聘用了该初创公司的顶尖工程师[54] - 有分析师认为公司市值将在未来一年左右超过6万亿美元[55] 行业竞争与格局变化 - 公司进军CPU市场,将对AMD和英特尔在人工智能数据中心的插槽争夺战构成严峻挑战[18] - 公司还需要与全球最大的超大规模数据中心运营商使用的各种定制Arm处理器展开竞争[16] - 包括OpenAI在内的众多大型客户已签约使用Cerebras的计算能力,以利用其平台优异的延迟特性[15] - 越来越多的迹象表明,公司正在将其重心从GPU转向推理计算解决方案提供商[56] - Meta宣布将在其人工智能数据中心部署数千颗英伟达Vera CPU,这是公司人工智能系统首次大规模部署且未使用GPU[56] - 据《华尔街日报》报道,公司计划推出新的采用多个独立于GPU的CPU的计算解决方案[57] - 英特尔宣布其Xeon 6处理器将作为Nvidia DGX Rubin NVL8系统的主机CPU,扩展了双方的合作[58] - 在推理迅速崛起的当下,公司能否继续垄断市场存在不确定性[62]