Workflow
NVIDIA Vera CPU
icon
搜索文档
AI算力行业周报:英伟达GTC 2026正式开幕,OFC 2026见证“互连爆发”
华鑫证券· 2026-03-23 13:24
报告行业投资评级 - 投资评级:推荐 维持 [2] 报告的核心观点 - 英伟达正从芯片供应商转型为全栈AI基础设施平台,其硬件、软件及太空数据中心布局展现了强大的生态构建能力,对AI芯片需求的预测极为乐观 [3] - 光通信行业正围绕AI数据中心互连需求进行技术爆发式创新,多个多源协议组织成立,推动高速、高密度、液冷光模块等新标准发展 [4] - AI算力需求持续驱动产业链各环节,PCB行业作为关键基础设施,在经历衰退后已进入复苏与增长阶段,高端产品需求旺盛 [27][28][29] - 全球科技巨头(如小米、谷歌、特斯拉)及政府机构(如美国国防部)均在AI领域进行大规模投入与战略布局,推动技术快速迭代与应用落地 [41][43][45][47][48] 根据相关目录分别进行总结 1. 算力板块周度行情分析 - **市场表现**:报告期内(3月16日-3月20日),申万一级行业中通信行业表现最佳,周涨幅为2.10%,位列第1位;电子行业下跌2.84%,位列第9位 [11] - **估值水平**:同期,电子行业市盈率为65.86,通信行业市盈率为54.09 [13][15] - **细分板块表现**:AI算力相关细分板块中,通信网络设备及器件板块涨幅最大,达7.38%;其他电源设备板块跌幅最大,为-6.76% [17][18] - **资金流向**: - 申万一级行业:通信板块主力净流入20.55亿元,净流入率0.26%,排名第1;电子板块主力净流出204亿元,净流入率-1.10% [22] - AI算力相关板块:通信网络设备及器件板块主力净流入4.54亿元,净流入率0.95%,排名第1;其他电源设备板块主力净流出31.98亿元,净流入率-4.34%,排名最后 [24][26] - **PCB板块复盘**: - **行业趋势**:PCB产业向中国大陆集中,高端市场(如高多层板、高频高速板)技术壁垒高,行业呈现集中化趋势 [27] - **行业周期**:2023年行业衰退,2024年开始复苏,2025年实现稳定增长 [28] - **近期数据**:下游AI算力需求旺盛。以中国台湾厂商数据为例,2026年1月PCB厂商营收达799.67亿新台币,同比增长29.77% [29][30] - **上游材料**:2026年2月,中国台湾PCB原料厂商营收396.13亿新台币,同比增长0.69%;铜箔基板厂商营收347.07亿新台币,同比增长0.84%;电子铜箔厂商营收8.51亿新台币,同比大幅增长51.13% [32][36] 2. 行业动态 - **小米AI投入**:小米计划未来三年在AI领域投入至少600亿元,2026年已超160亿元。发布了万亿参数MoE架构大模型,在多项评测中位居前列 [41][42] - **谷歌生态竞争**:谷歌正为苹果Mac开发专用Gemini应用,以加强与OpenAI、Anthropic的竞争,目前已进入早期测试阶段 [43][44] - **美国AI政策**:特朗普政府发布AI政策框架,敦促国会制定全国统一法规,旨在保护儿童、简化数据中心审批流程并确保美国在AI领域的全球主导地位 [45][46] - **特斯拉芯片进展**:特斯拉CEO马斯克表示,其下一代2nm AI6芯片有望在2026年12月完成流片,由三星电子生产,计划于2027年下半年量产 [47] - **军事AI应用**:美国国防部计划将Palantir的Maven AI系统列为美军正式备案项目,预计将锁定一份价值13亿美元的长期合同,该系统已在近期军事行动中使用 [48][49] 3. 公司公告 - **首都在线**:公告显示,截至2025年底,公司未弥补亏损金额超过实收股本总额的三分之一,主要因前期云平台建设投入大、折旧摊销费用高及计提资产减值所致 [51][52] - **通富微电**:公司董事会审议通过,为全资附属机构钜天投资提供不超过14亿元的担保 [53] - **优刻得**:公司公告2026年度向特定对象发行A股股票预案,并声明不存在向认购方提供财务资助或补偿的情况 [54][55] 4. 重点关注公司及盈利预测 - 报告列出四家公司的盈利预测与评级: - **香农芯创 (300475.SZ)**:评级为“买入”,2026年预测EPS为2.36元,预测PE为66.59 [5] - **国科微 (300672.SZ)**:评级为“买入”,2026年预测EPS为2.24元,预测PE为87.10 [5] - **沃尔核材 (002130.SZ)**:未评级,2026年预测EPS为1.39元,预测PE为17.76 [5] - **立讯精密 (002475.SZ)**:未评级,2026年预测EPS为3.00元,预测PE为16.06 [5] - 报告在行业动态部分建议关注:国科微、香农芯创、立讯精密、沃尔核材 [4]
英伟达GTC2026正式开幕,OFC2026见证“互连爆发”
华鑫证券· 2026-03-23 11:00
报告投资评级 - 行业投资评级:推荐(维持) [2] 报告核心观点 - 英伟达正从芯片供应商转型为全栈AI基础设施平台,其CEO黄仁勋预期Blackwell与Rubin AI芯片到2027年的需求将至少达到1万亿美元,较去年的预测已翻倍 [3] - 在OFC 2026期间,多个多源协议组织成立,聚焦超大规模AI数据中心的互连需求,其中XPO MSA定义的液冷可插拔光模块提供业界最高12.8Tbps容量,已有60多家企业参与 [4] - AI算力需求旺盛,特别是下游AI算力需求带动了AI-PCB(印刷电路板)的需求提升,中国台湾PCB厂商2026年1月营收达到799.67亿新台币,同比增长29.77% [29] 根据目录总结 1. 算力板块周度行情分析 - **行业涨跌幅**:3月16日-3月20日当周,申万一级行业中通信行业上涨2.10%,位列第1位;电子行业下降2.84%,位列第9位 [11] - **行业估值**:同期,电子行业市盈率为65.86,通信行业市盈率为54.09 [13][15] - **细分板块表现**:AI算力相关细分板块中,通信网络设备及器件板块涨幅最大,达到7.38%;其他电源设备板块跌幅最大,为-6.76% [17] - **细分板块估值**:数字芯片设计、其他电源设备、通信网络设备及器件板块的市盈率位列前三,其中数字芯片设计板块市盈率为107.64 [17][20] - **资金流向(申万一级)**:上周通信板块主力净流入20.55亿元,净流入率为0.26%,在31个行业中排第1名;电子板块主力净流出204亿元,净流入率为-1.10% [22] - **资金流向(AI算力细分)**:通信网络设备及器件板块主力净流入4.54亿元,净流入率为0.95%,在8个子行业中排第1;其他电源设备板块主力净流出3.20亿元,净流入率为-4.34%,排第8 [24][26] - **PCB行业复盘**:AI算力需求旺盛带动AI-PCB需求提升,中国台湾PCB厂商2026年1月营收达到799.67亿新台币,同比增长29.77% [29] - **PCB上游材料**:2026年2月,中国台湾PCB原料厂商营收396.13亿新台币,同比增长0.69%;铜箔基板厂商营收347.07亿新台币,同比增长0.84%;电子铜箔厂商营收8.51亿新台币,同比增长51.13% [32][36] 2. 行业动态 - **小米AI投入**:小米计划未来三年在AI领域投入至少600亿元,2026年AI研发与资本开支已超过160亿元,并推出了总参数达1万亿的MoE架构大模型 [41] - **谷歌动态**:谷歌正在为苹果Mac开发专用Gemini AI应用,以加强与OpenAI和Anthropic的竞争 [43] - **美国AI政策**:特朗普政府发布AI政策,敦促国会制定统一法规以取代各州监管,保护儿童并应对AI带来的能源成本等问题 [45] - **特斯拉芯片**:特斯拉CEO埃隆·马斯克表示,公司可能在2026年12月完成其下一代2nm AI6芯片的流片 [47] - **Palantir军事合同**:美国国防部计划将Palantir的Maven AI系统列为美军正式备案项目,预计将锁定13亿美元的长期合同 [48] 3. 公司公告 - **首都在线**:公司2025年度合并报表未分配利润为-7.94亿元,未弥补亏损金额超过实收股本总额的三分之一,主要因加大云平台和智算资源建设投入导致折旧摊销费用增长 [51][52] - **通富微电**:公司董事会审议通过为下属控制企业钜天投资提供不超过人民币14亿元的担保 [53] - **优刻得**:公司公告2026年度向特定对象发行A股股票的相关议案,并声明不存在向认购投资者提供财务资助或补偿的情况 [54][55] 重点关注公司及盈利预测 - **香农芯创 (300475.SZ)**:股价157.15元,2026年预测EPS为2.36元,预测PE为66.59,投资评级为“买入” [5] - **国科微 (300672.SZ)**:股价195.10元,2026年预测EPS为2.24元,预测PE为87.10,投资评级为“买入” [5] - **沃尔核材 (002130.SZ)**:股价24.61元,2026年预测EPS为1.39元,预测PE为17.76,投资评级为“未评级” [5] - **立讯精密 (002475.SZ)**:股价48.22元,2026年预测EPS为3.00元,预测PE为16.06,投资评级为“未评级” [5]
美股科技行业周报:英伟达GTC2026召开,推理时代正式来临,持续好看算力需求加速增长-20260322
国联民生证券· 2026-03-22 21:05
报告行业投资评级 - 报告对美股科技行业给出“推荐”评级 [31] 报告的核心观点 - 英伟达GTC 2026大会标志着AI从“训练驱动”全面转向“推理驱动”,推理时代正式来临,算力需求将持续加速增长 [2][14] - 英伟达的核心竞争力正从卖芯片拓展至“算力+存储+网络”的系统级交付能力,实现了范式转移 [31] - AI Agent的普及将驱动Token消耗快速增长,持续增长的KV Cache将推动对HBM、DRAM、SSD的存储需求,而供给侧扩产谨慎,供不应求的局面可能持续更长时间 [31] - 看好Scale-up中光互连渗透率的持续提高,Agent-to-Agent协作将产生海量通讯流量,驱动更高带宽迭代 [31] - 投资上应关注具备系统级底层基础设施能力、存储以及高速光互连领域的标的 [31] 根据相关目录分别进行总结 1 科技行业动态 - **英伟达上调收入预期**:随着AI转向“推理驱动”,英伟达进一步上调2027年收入预期至1万亿美元,此前预测Blackwell与Rubin平台至2026年累计订单达5000亿美元 [2][14] - **Vera Rubin平台量产**:该超级AI平台已全面投产,由七款芯片组成,覆盖计算、网络、存储功能,包含40个机架、1.2千万亿个晶体管、近2万个芯片、1152个Rubin GPU,拥有60 exaflops运算能力和10 PB/s总扩展带宽,核心客户包括Anthropic、OpenAI、Meta、Mistral AI及全球主要云提供商 [2][16] - **推出Vera CPU**:英伟达推出全新的数据中心NVIDIA Vera CPU,针对单线程性能、大规模数据处理和能效优化,是全球首个在数据中心采用LPDDR5内存的CPU,已开始单独销售,有望成为数十亿美元级核心业务 [3][19] - **平台技术特点**:Vera Rubin平台采用100%液冷架构,使用45℃热水散热,降低制冷成本;系统内部布线简化,整机安装时间从两天缩短至约两小时 [19] - **网络互连创新**:平台引入第六代NVLink互连架构,强化GPU间横向扩展与通信带宽;同时推出全球首款基于CPO技术的NVIDIA Spectrum-X以太网交换机,将光模块集成于芯片封装内,已进入量产阶段 [3][23] - **发布Groq LPU推理芯片**:正式发布集成Groq LPU架构的推理芯片,Groq3LPU单芯片集成500MB片上SRAM,存储带宽高达150TB/s(对比主流GPU片外HBM4带宽约22TB/s);Groq 3LPX机架搭载256个LPU,提供128GB片上SRAM和高达40PB/s的推理加速带宽,每个机架专用扩展接口带宽为640TB/s,该芯片由三星电子代工,已进入生产阶段 [4][25] 2 美股科技公司动态 - **美光科技FY26Q2业绩创纪录**:实现收入239亿美元,同比增长196%,环比增长75%;Non-GAAP毛利率为75%,环比提升18个百分点,创历史新高;Non-GAAP EPS为12.20美元,环比增长155% [5][29] - **业务驱动因素**:AI推动DRAM与NAND需求显著提升,数据中心存储需求占比将在2026年首次超过行业总需求的50%;HBM4已开始量产并应用于下一代AI平台(如Vera Rubin),HBM4E预计2027年放量 [5][30] - **业绩细分**:DRAM收入188亿美元(占比79%),同比增长207%,环比增长74%;NAND收入50亿美元(占比21%),同比增长169%,环比增长82% [29] - **供给紧张**:行业供给极度紧张,仅能满足核心客户约50%-70%的需求,供需紧张状态预计将持续至2026年以后 [30] - **业绩指引强劲**:预计FY26Q3收入335亿美元(±7.5亿美元),将再创历史新高;毛利率约81%;EPS约19.5美元(±0.4美元) [30] - **资本开支计划**:预计FY26全年CapEx超过250亿美元,FY27将进一步显著提升,主要用于HBM与DRAM产能扩张及全球晶圆厂建设 [5][30] 3 本周观点 - **投资主线**:看好具备系统级别底层基础设施能力的标的、存储标的与高速光互连标的 [31] - **具体关注公司**:建议关注【GOOG】(谷歌)、【NVDA】(英伟达)、【MU】(美光科技)、【SNDK】(闪迪)、【LITE】(Lumentum)、【COHR】(Coherent)[31]
Supermicro Advances Enterprises' Adoption of Accelerated Computing Across AI Factory, Data Center, and Edge with Expanded Portfolio Featuring NVIDIA RTX PRO Blackwell Server Edition GPUs
Prnewswire· 2026-03-18 21:05
产品组合扩展与核心发布 - Super Micro Computer, Inc. (SMCI) 宣布扩展其企业解决方案组合,新增支持NVIDIA RTX PRO 4500 Blackwell服务器版GPU和NVIDIA Vera CPU的系统,以满足AI和图形计算应用日益增长的需求[1][2] - 新系统将NVIDIA RTX PRO 4500 Blackwell服务器版GPU的加速能力,以针对企业数据中心和边缘环境优化的外形规格推向市场,这些环境此前因空间、功耗和冷却限制而难以部署高密度计算基础设施[1] - 公司提供经过测试和验证的NVIDIA认证系统,保证与NVIDIA RTX PRO Blackwell GPU、NVIDIA网络以及NVIDIA AI Enterprise和Omniverse库的兼容性,并支持广泛的认证第三方应用以加速企业工作负载[1] 技术规格与性能优势 - 搭载NVIDIA RTX PRO Blackwell GPU的系统可直接替换标准的1U和2U机架式企业服务器,与仅使用CPU的计算相比,能为特定工作负载带来显著的加速提升,且易于集成到现有数据中心,对现有机架、电源或冷却基础设施的改动需求极小[3] - 新的NVIDIA RTX PRO 4500 Blackwell GPU采用单槽、高能效设计,为苛刻的数据处理、AI视频和推理工作负载提供突破性性能[4] - 针对紧凑型边缘AI解决方案,系统支持多达4个风冷NVIDIA RTX PRO Blackwell GPU,且每个GPU的功耗可低至165瓦,使组织能够在靠近数据源的地方处理AI推理请求和图形工作负载[7] 解决方案分类与应用场景 - **大规模AI解决方案**:采用4U和5U系统设计,旨在实现最大GPU容量,并在传统风冷环境中优化散热性能。每个节点支持多达8个NVIDIA RTX PRO Blackwell GPU,适用于大规模AI推理、虚拟化和媒体/图形工作负载[5] - **企业AI和数据中心解决方案**:采用行业标准1U和2U外形规格,旨在轻松替换传统的纯CPU计算硬件,无需重新设计数据中心。系统支持多达6个NVIDIA RTX PRO Blackwell GPU,为空间、机架功率和冷却基础设施有限的数据中心环境提供平衡的加速与效率。产品组合还包括基于NVIDIA Vera CPU的新型2U架构,专为瞄准下一代智能体AI部署的组织构建[6] - **紧凑型边缘AI解决方案**:采用针对能效优化的系统设计,旨在将强大的加速能力带到通常存在严重散热和功耗限制的边缘环境。提供1U和2U短深度机箱外形规格[7] 公司战略与市场定位 - 公司总裁兼首席执行官Charles Liang表示,随着各类企业持续加快AI采用步伐,Supermicro再次引领行业,将新的NVIDIA加速技术推向市场,平衡性能与效率,在最需要的地方实现加速计算[2] - 公司通过其灵活、模块化的“积木式解决方案”架构支持NVIDIA RTX PRO Blackwell GPU,帮助企业缩短上线时间,使其能更快地从基础设施投资中实现价值[2] - Supermicro是一家全球领先的应用优化全IT解决方案提供商,致力于为企业、云、AI和5G电信/边缘IT基础设施提供率先上市的创新。公司是提供服务器、AI、存储、物联网、交换系统、软件和支持服务的全IT解决方案供应商[9] - 公司的“积木式解决方案”产品组合允许客户从广泛的系统家族中选择,这些系统由灵活可重复使用的构建块组成,支持全面的外形规格、处理器、内存、GPU、存储、网络、电源和冷却解决方案,以优化其确切的工作负载和应用[9]
英伟达连发7款“王炸”芯片,目标从芯片商转向AI工厂!黄仁勋的思路变了?业内:一句话总结就是“卖标准”
每日经济新闻· 2026-03-18 17:26
公司战略定位与核心竞争力 - 公司正从一家芯片公司转向AI工厂和AI基础设施公司[2] - 公司的核心战略是“卖铲子”,即提供AI基础设施和工具,而非直接参与AI应用开发[2][16] - 公司的核心竞争力在于构建并销售算力生态,而非单纯卖算力,这包括将生成式大模型与3D图形引擎融合来兜售算力需求概念[2][16] 产品与技术发布 - 在GTC 2026大会上,公司发布了由7款芯片、5种机架组成的Vera Rubin巨型超级计算机平台[8] - 发布的7款芯片包括:NVIDIA Vera CPU、NVIDIA Rubin GPU、NVIDIA NVLink 6交换机、NVIDIA ConnectX-9 SuperNIC、NVIDIA BlueField-4 DPU、NVIDIA Spectrum-6以太网交换机以及NVIDIA Groq 3 LPU[8] - 公司推出了NVIDIA NemoClaw™软件栈,适用于OpenClaw智能体平台,提供开放模型和沙盒环境以增强数据隐私和安全性[7] 关键产品性能与部署 - Vera CPU是全球首款专为代理式AI与强化学习时代打造的处理器,效率是传统机架级CPU的2倍,速度提升50%,目前已进入全面量产,将于2025年下半年向合作伙伴提供[9] - Groq 3 LPU是一款专门用于大语言模型推理的处理器,将与GPU在Vera Rubin平台中协同工作[9] - 阿里巴巴、联想等中国企业出现在合作部署Vera CPU的头部企业名单中,字节跳动则出现在计划部署Vera CPU的云服务提供商名单中[9] 市场趋势与公司策略 - 公司认为Agentic AI的拐点已经到来,并将引发史上规模最大的基础设施建设浪潮[8] - 随着AI应用大规模落地,推理算力需求将呈指数级爆发,定制化推理芯片的春天或将来临[9] - 公司的整体思路是跟随“烧更多Token”的模式,通过构建系统生态、提供“烧Token”的工具、优化系统降低Token成本来吸引用户[1][12] 财务目标与成本优化 - 公司CEO黄仁勋提出,公司算力芯片到2027年将实现1万亿美元营收,这相比其对2026年5000亿美元市场需求的预测翻了一倍[12] - 为实现营收目标,公司强调算力需要更具“性价比”,并提出了“每瓦Token数”作为核心评价指标,公司自称在该指标上处于世界领先位置[12] 对行业生态的布局 - 公司高度评价OpenClaw,称其开启了AI的下一个前沿领域,是“人类历史上最受欢迎的开源项目”,并认为其实质上开源了智能体计算机的操作系统,是软件新复兴的开始[3] - 公司认为OpenClaw将推动传统的SaaS(软件即服务)全面进化为“智能体即服务(AaaS)”,未来企业为每位工程师配备“年度token预算”将成为推动生产力十倍增长的新标配[3] - 公司通过吸纳Groq部分核心成员并达成技术授权协议,以推进AI推理技术的规模化[9]
英伟达塑造“Token经济学”
21世纪经济报道· 2026-03-18 07:10
Vera Rubin平台与芯片发布 - 公司宣布Vera Rubin平台开启Agentic AI新时代,旨在构建全球最大的AI工厂,该平台包含七款已全面投入生产的新芯片[1][14] - 七款芯片包括:NVIDIA Vera CPU(服务器CPU)、NVIDIA Rubin GPU、NVIDIA NVLink 6(第六代交换机芯片)、NVIDIA ConnectX-9 SuperNIC(超级网卡)、NVIDIA BlueField-4 DPU(存储芯片)、NVIDIA Spectrum-6(支持CPO技术的以太网交换机芯片)以及新集成的NVIDIA Groq 3 LPU[1][15] - 这些芯片能够组成五种机架在数据中心运行,标志着公司从单一芯片竞争进入全方位的系统级竞赛阶段[1][16] 技术规格与性能突破 - Rubin架构计划于2026年下半年量产,采用台积电3nm工艺,Vera CPU(88核自研架构)与Rubin GPU通过1.8 TB/s的NVLink-C2C技术实现同封装集成[4][18] - 采用“去PCIe化”紧耦合设计,单GPU在NVFP4精度下的推理算力增至50 PFlops,训练算力达35 PFlops,规模化推理能效较Blackwell提升5倍[4][18] - 平台为Agentic AI与长上下文推理设计,引入Transformer Engine 3.0等技术,使AI能处理数万个Token的上下文,单机柜NVL72内部互联总带宽达260 TB/s[5][19] - Vera CPU机架集成256个Vera CPU,基于MGX液冷基础设施,其效率是传统CPU的两倍,速度提升50%[5][19] 市场预测与客户进展 - 公司CEO预测,Blackwell与Rubin的AI芯片到2027年底的收入将达到1万亿美元,较去年10月的5000亿美元预测翻倍[2][15] - 已确认合作部署Vera CPU的客户包括阿里巴巴、字节跳动、Meta、Oracle Cloud Infrastructure、CoreWeave、Lambda、Nebius和Nscale,芯片已全面投产并将于今年下半年供货[6][20] Groq LPU与混合算力战略 - 公司通过200亿美元战略授权并集成Groq LPU架构,新推出的Groq 3 LPX机架包含256个LPU处理器,具有128GB片上SRAM和640 TB/s扩展带宽[6][21] - LPU采用确定性流水线架构,消除计算抖动,专为Agentic AI与实时交互设计,能保证毫秒级任务的执行时间恒定,将复杂Agent链条的思考时间从数分钟缩短至数秒[9][22] - 公司构建混合算力帝国:GPU负责万亿参数模型训练与长文本预处理,LPU阵列以10倍于对手的能效比统治实时推理市场,实现训练与推理分离[10][23] 软件、模型与生态系统建设 - 面向OpenClaw社区推出NemoClaw软件栈,提供基础软件能力,支持通过一条命令安装Nemotron模型和OpenShell运行时环境,为AI代理增加安全与隐私控制[11][23] - NemoClaw支持本地与云端模型混合调用,可运行于GeForce RTX设备、RTX PRO工作站及DGX系统,为全天候AI代理提供算力[12][24] - 宣布成立Nemotron联盟,联合全球AI实验室推进开放前沿模型发展,并扩展Nemotron 3系列多模态模型,包括Ultra、Omni和VoiceChat等版本[12][24] - 发布应用于物理世界的新模型,包括面向类人机器人的Isaac GR00T N1.7模型、面向自动驾驶的Alpamayo 1.5模型,以及即将推出的统一世界基础模型Cosmos 3[13][25] 行业趋势与战略定位 - 公司CEO强调“Token”是AI时代的新货币,AI工厂是生成Token的基础设施,公司通过Vera Rubin DSX AI Factory参考设计和Omniverse数字孪生蓝图提供构建最高生产力AI工厂的基础[6][20] - 行业趋势显示,巨头正通过聚集能力、补齐短板、延伸上下游来构建强大壁垒,单一比拼芯片性能的阶段已过去,系统级竞赛正在上演[2][16]
黄仁勋塑造“Token经济学” 英伟达拥抱智能体时代
21世纪经济报道· 2026-03-18 06:29
英伟达GTC大会核心发布 - 公司宣布其最新芯片架构Vera Rubin平台已全面投入生产,该平台包含七款新芯片和五种机架,旨在开启Agentic AI新时代并构建全球最大的AI工厂 [1] - 公司创始人预测,基于Blackwell与Rubin架构的AI芯片,到2027年底的收入将达到1万亿美元,较去年10月的5000亿美元预测翻倍 [2] - 发布会标志着行业竞争从单一芯片性能比拼进入全方位的系统级竞赛阶段 [2] Vera Rubin平台技术革新 - Rubin架构计划于2026年下半年量产,采用台积电3nm工艺,其Vera CPU与Rubin GPU通过1.8 TB/s的NVLink-C2C技术实现同封装集成,是“去PCIe化”的紧耦合设计 [2] - 单GPU在NVFP4精度下的推理算力增至50 PFlops,训练算力达35 PFlops,规模化推理能效较Blackwell提升5倍 [3] - 平台引入Transformer Engine 3.0与Inference Context Memory存储平台,并配备支持硅光子技术的Spectrum-X网络,单机柜NVL72内部互联总带宽达260 TB/s [3] 新芯片产品组合 - 七款新芯片包括:NVIDIA Vera CPU、NVIDIA Rubin GPU、NVIDIA NVLink 6、NVIDIA ConnectX-9 SuperNIC、NVIDIA BlueField-4 DPU、NVIDIA Spectrum-6以及新集成的NVIDIA Groq 3 LPU [1] - Vera CPU机架集成256个Vera CPU,其效率是传统CPU的两倍,速度提升50% [4] - 与公司合作部署Vera CPU的客户包括阿里巴巴、字节跳动、Meta、Oracle Cloud Infrastructure等,该产品已全面投产并将于今年下半年供货 [4] Groq LPU推理芯片战略 - 公司通过200亿美元战略授权并深度集成Groq LPU架构,新推出的Groq 3 LPX机架包含256个LPU处理器,具有128GB片上SRAM和640 TB/s扩展带宽 [5] - LPU采用确定性流水线架构,旨在实现极低延迟和确定性算力,专为实时交互场景设计,如自动驾驶和高频交易 [6] - LPU与GPU通过NVFusion技术协同,构建混合算力帝国:GPU负责训练,LPU负责高效实时推理,能效比号称可达对手的10倍 [7] AI代理与软件生态进展 - 公司推出面向OpenClaw社区的NemoClaw软件栈,提供基础软件能力,支持通过一条命令安装模型和OpenShell运行时环境,并增强安全与隐私控制 [8] - NemoClaw支持本地模型与云端模型的混合调用,可运行在多种计算平台上,为全天候运行的AI代理提供算力 [9][10] - 公司宣布成立Nemotron联盟,联合全球AI实验室共同推进开放前沿模型发展,并扩展了Nemotron 3系列多模态模型 [10] 物理智能与行业应用扩展 - 公司发布用于机器人和自动驾驶的新模型,包括面向类人机器人的NVIDIA Isaac GR00T N1.7模型和面向自动驾驶的NVIDIA Alpamayo 1.5模型 [11] - 即将推出的NVIDIA Cosmos 3被称为首个统一“世界生成、物理推理和行动仿真”的世界基础模型 [11] - 公司正搭建一个覆盖数字世界与物理世界的AI技术体系,推动人工智能在机器人、自动驾驶等领域的创新与落地 [11]
到明年底,至少赚1万亿”!英伟达连发7款芯片,还推出自己的“龙虾
国际金融报· 2026-03-17 19:24
英伟达GTC 2026大会核心发布 - 公司创始人兼CEO黄仁勋发表主题演讲,预测到2027年AI芯片营收至少达到1万亿美元,并发布七款新芯片及“Token工厂经济学”新概念 [1] - 公司推出NemoClaw平台以支持OpenClaw生态 [1] - 资本市场反应积极,公司股价盘中一度上涨超过4% [1] 财务预测与市场影响 - 公司预测新一代Blackwell架构与下一代Rubin产品到2027年底将创造至少1万亿美元收入,较2025年10月给出的5000亿美元预测直接翻倍 [4] - 高盛研报指出,此长期收入可见度“大幅超出了华尔街的普遍预期”,缓解了市场对人工智能资本支出可能在2026年触及顶峰的担忧 [4] - 然而,A股算力板块在消息后早盘遭遇大跌,光模块、光通信等赛道领跌,部分龙头股跌幅超过10%,显示“利好兑现”后的短期回调压力 [3] 新产品与技术平台 - 公司全面亮相Vera Rubin AI计算系统,强调其并非单一芯片,而是由7种芯片与5种机架系统组成的完整AI超级计算机平台 [5] - 七款芯片包括:NVIDIA Vera CPU、NVIDIA Rubin GPU、NVIDIA NVLink 6交换机、NVIDIA ConnectX-9 SuperNIC、NVIDIA BlueField-4 DPU、NVIDIA Spectrum-6以太网交换机及NVIDIA Groq 3 LPU [5] - Vera CPU作为全球首款专为智能体AI和强化学习打造的处理器,效率是传统机架级CPU的两倍,速度提升50%,已确定将部署于阿里巴巴、字节跳动、Meta等云服务提供商 [5] - 黄仁勋将Vera Rubin描述为“一次划时代的飞跃”,宣告“代理式AI的拐点已经到来” [5] “Token工厂经济学”新框架 - 公司提出“Token工厂经济学”新概念,用以解释万亿美元级AI芯片需求的商业逻辑 [6] - 未来的数据中心将被视为不间断生产Token(人工智能大模型理解和生成语言的最小语义单元)的巨型工厂,其产能受物理定律限制于固定的电力 [7] - 在固定功率下,每瓦Token吞吐量最高的工厂生产成本最低,吞吐量和Token生成速度将直接转化为企业收入 [7] - 此理论为投资者提供了从销售芯片转向衡量AI工厂生产效率的新估值坐标系 [7] - 该框架亦可能重塑职场形态,未来公司或为工程师配置年度Token预算以提升效率 [7] 软件生态与“龙虾”战略 - 公司将开源项目OpenClaw(“龙虾”)提升至战略高度,形容其为“人类历史上最受欢迎的开源项目”,并称其几周内取得的成就超越了Linux过去30年 [8] - OpenClaw被认为像Windows普及个人电脑一样,有潜力将AI智能体普及到每一个普通人手中 [8] - 为此,公司推出专为OpenClaw深度优化的部署工具链NemoClaw,仅需两行命令即可完成安装,旨在让每一台GPU服务器都能无缝接入OpenClaw生态 [9]
黄仁勋发表重磅演讲!称2027营收至少万亿美元,“龙虾”就是新操作系统!英伟达宣布:七款新芯片全面投产
每日经济新闻· 2026-03-17 10:53
公司核心产品与战略 - 英伟达在GTC 2026大会上宣布,基于Vera Rubin架构的七款新芯片已全面投入生产,产品线包括NVIDIA Vera CPU、NVIDIA Rubin GPU、NVIDIA NVLink 6、NVIDIA ConnectX-9 SuperNIC、NVIDIA BlueField-4 DPU、NVIDIA Spectrum-6以及新集成的NVIDIA Groq 3 LPU [2][12][13] - 这些芯片可组成5款机架,Vera Rubin平台将其整合为一台强大的AI超级计算机,能够支持大规模预训练、后训练、测试时扩展以及实时智能推理 [2][3][12] - 公司CEO黄仁勋将Vera Rubin平台定义为一次“代际跃迁”,并称其将开启Agentic AI新时代,构建全球最大的AI工厂,推动历史上最大规模的基础设施建设 [2][3][12] 财务预测与市场前景 - 公司CEO黄仁勋预测,其新一代AI加速芯片架构Blackwell与下一代Rubin产品,到2027年底将创造至少1万亿美元收入,这一预测较其2025年10月给出的5000亿美元销售预测翻倍 [1][3][4] - 黄仁勋表示,目前对Blackwell和Rubin产品到2027年已看到至少1万亿美元的高确信度需求 [4][16] - 此预测发布后,英伟达股价盘中最多上涨超4%,最终收盘上涨1.6% [16] 行业范式与商业模式革新 - 公司CEO黄仁勋提出了“代币工厂(Token Factory)”概念,指出未来的数据中心将不再是存储中心,而是生产智能代币(Token)的工厂 [1][5][11] - 黄仁勋阐述了“Token工厂经济学”,认为在受电力限制(如1吉瓦)的数据中心里,每瓦Token吞吐量最高的厂商将拥有最低的生产成本 [7][17][20] - 黄仁勋将未来的AI服务划分为五个商业层级:免费层(高吞吐、低速度)、中级层(约每百万token 3美元)、高级层(约每百万token 6美元)、高速层(约每百万token 45美元)和超高速层(约每百万token 150美元) [7][20] 技术优势与性能表现 - 黄仁勋强调,英伟达的架构能够让客户在免费层实现极高的吞吐量,同时在最高价值的推理层级上,将性能提升惊人的35倍 [7][21] 软件生态与行业影响 - 黄仁勋高度评价开源项目OpenClaw,称其为“人类历史上最受欢迎的开源项目”,仅用几周时间就超越了Linux过去30年的成就,并指出OpenClaw本质上是Agent计算机的“操作系统” [9][23] - 黄仁勋断言,每一个SaaS公司都将变成AaaS(智能体即服务)公司,为此英伟达推出了企业级的NeMo Claw参考设计,增加了策略引擎和隐私路由器以确保智能体安全 [9][23] - 黄仁勋描绘了未来的职场形态,指出工程师将获得年度Token预算,其额度可能约为基础年薪(几十万美元)的一半,以实现10倍的效率提升,这已成为硅谷新的招聘筹码 [9][23] 未来技术路线图 - 黄仁勋在演讲最后“剧透”了下一代计算架构Feynman,它将首次实现铜线与CPO的共同水平扩展 [9][23] - 英伟达正在研发可部署在太空的数据中心计算机“Vera Rubin Space-1”,探索AI算力向地球之外延伸 [9][23]
燃爆!英伟达连发7款芯片,黄仁勋剑指万亿AI芯片收入
21世纪经济报道· 2026-03-17 09:17
公司产品发布:Vera Rubin平台与芯片家族 - 英伟达在GTC大会上宣布,Vera Rubin芯片架构已有七款新芯片全面投入生产,该平台旨在开启Agentic AI新时代并构建全球最大的AI工厂 [1] - 七款新芯片包括:NVIDIA Vera CPU、NVIDIA Rubin GPU、NVIDIA NVLink 6、NVIDIA ConnectX-9 SuperNIC、NVIDIA BlueField-4 DPU、NVIDIA Spectrum-6以及新集成的NVIDIA Groq 3 LPU,这些芯片可组成5款机架在数据中心运行 [2] - Vera Rubin平台将这些芯片汇聚成一台强大的AI超级计算机,可支持大规模预训练、后训练、测试时扩展以及实时智能推理 [2] 技术架构与性能突破 - Rubin架构全面采用台积电3nm工艺,其Vera CPU与Rubin GPU通过1.8 TB/s的NVLink-C2C技术实现同封装集成,这种"去PCIe化"设计使单GPU在NVFP4精度下的推理算力增至50 PFlops,训练算力达35 PFlops [6] - 与Blackwell平台相比,Rubin在训练大型混合专家模型时仅需四分之一数量的GPU,实现每瓦推理吞吐量最高10倍,同时每token成本为十分之一 [7] - 核心机架产品Vera Rubin NVL72通过NVLink 6连接72个Rubin GPU和36个Vera CPU,内部互联总带宽达到260 TB/s,相当于全球互联网跨境带宽总和的数倍 [6][7] 系统级创新与AI工厂 - 英伟达的竞争已从单芯片过渡到AI基础设施系统化建设,2026年开启了系统级进化的新纪元 [4] - 公司推出Vera Rubin DSX AI工厂参考设计,教客户如何设计、建设和运营整个AI工厂基础设施堆栈,以实现可重复、可扩展且最优的集群性能 [10] - 新的DSX平台包括DSX Max-Q和DSX Flex软件,前者可在固定电力的数据中心内部署30%更多的AI基础设施,后者可使AI工厂成为电网灵活资产,从而释放100 gigawatts的闲置电网电力 [8][9] 市场预测与战略定位 - 公司创始人预测,Blackwell与Rubin的AI芯片到2027年底的收入将达到1万亿美元,相比去年10月的5000亿美元销售预测已经翻倍 [3] - 公司正从AI时代的"铲子商"转型为构建从算力到应用完整体系的基础平台,试图成为AI时代中水和电的角色 [5] - 公司锁定了至少未来5年的算力交付能力,其技术路径预览明确,从Hopper、Blackwell到Rubin,再到已预告的下一代Feynman系统 [3][10] Groq LPU整合与推理革命 - 公司通过200亿美元战略授权并深度集成Groq LPU架构,将AI竞争从"训练效率"扩展到"推理效率" [11] - 推出的Groq 3 LPX机架包含256个LPU处理器,具有128GB片上SRAM和640 TB/s的扩展带宽,与Vera Rubin NVL72协同可提升解码速度 [11] - LPU采用确定性流水线架构,密布高达230MB的片上SRAM,内存带宽达80 TB/s,是顶级Blackwell GPU的十倍,能在单批次推理中实现极低延迟,Token生成速度稳定在1600 tokens/s以上 [12][13] - LPX与Vera Rubin结合,可实现每兆瓦推理吞吐量最高35倍,并为万亿参数模型带来最高10倍的收入机会 [11] 软件与开发生态布局 - 公司推出面向OpenClaw生态的NemoClaw软件栈,提供基础软件能力,使开发者可以通过命令安装模型和OpenShell运行时环境,并为AI代理增加安全与隐私控制能力 [16][17] - NemoClaw支持本地模型与云端模型的混合调用,可运行在多种计算平台上,包括搭载GeForce RTX的PC、笔记本电脑、工作站及DGX系统 [18] - 公司宣布成立Nemotron Coalition,联合全球多家领先AI实验室与模型开发机构共同推进开放前沿模型的发展,创始成员包括Mistral AI、Perplexity等 [18] 模型与应用扩展 - NVIDIA Nemotron 3系列模型推出Ultra、Omni和VoiceChat等多个版本,强化多模态理解能力,可同时处理语言、视觉与语音信息 [20] - 公司推出用于现实世界的AI模型,包括面向类人机器人的NVIDIA Isaac GR00T N1.7、面向自动驾驶的NVIDIA Alpamayo 1.5以及即将推出的统一世界基础模型NVIDIA Cosmos 3 [20] - 公司还发布了面向物理AI的开放式Physical AI数据工厂蓝图,以及将AI引入轨道的太空计算服务 [5]