Rubin GPU
搜索文档
英伟达重磅布局“服务器CPU”,黄仁勋:将推出Vera CPU
华尔街见闻· 2026-01-27 17:56
公司战略布局 - 英伟达正通过推出代号为"Vera"的全新CPU并首次作为独立产品推向市场,以巩固其在AI基础设施市场的统治地位,并消除AI供应链中的算力瓶颈[2] - 此举标志着公司在计算堆栈层面的重大战略转折,旨在为客户提供更具成本效益的高端计算替代方案,使其工作负载能在英伟达的CPU和GPU上运行,这将对现有服务器处理器市场格局产生直接影响[4] - 这一战略不仅针对高端机架级解决方案,也开始向更广泛的通用计算市场渗透,试图构建一个全栈式的计算生态系统[6] - 公司大力推行独立CPU策略的背后,是对AI供应链瓶颈的深刻洞察,随着代理人工智能应用的加速普及,服务器CPU正逐渐成为制约系统整体性能的关键因素[16] 产品与技术细节 - Vera CPU基于下一代定制Arm架构,代号为"Olympus",配备了88个核心和176个线程,并引入了"空间多线程"技术[9][10] - 该CPU配备了1.5 TB的系统内存,是上一代Grace CPU的三倍,同时采用SOCAMM LPDDR5X技术,实现了1.2 TB/s的内存带宽[10] - 通过NVLink-C2C互连技术,其相干内存互连速度高达1.8 TB/s,是Grace的两倍[10] - 相比于Grace CPU,Vera每个核心拥有2MB的L2缓存(是Grace的两倍),以及162MB的共享L3缓存(提升了42%)[12] - Vera CPU是英伟达下一代Vera-Rubin平台的核心组件,该平台将Vera CPU与代号为"Rubin"的下一代GPU相结合[13] - Rubin GPU预计将采用HBM4内存,带宽高达22 TB/s,是Blackwell GPU的2.75倍[14] 关键合作与市场推广 - 新兴云服务商CoreWeave将成为首家部署Vera CPU作为独立基础设施选项的客户,英伟达已承诺向其追加20亿美元投资[2] - CoreWeave正计划在2030年前建设5吉瓦(GW)的AI工厂[7] - 除了CoreWeave,英伟达Vera-Rubin系统的早期客户名单还包括亚马逊AWS、谷歌Cloud、微软Azure、甲骨文Cloud Infrastructure等云巨头,以及Lambda、Nebius和Nscale等新兴玩家[17] - Vera-Rubin NVL72平台的核心芯片已从台积电返回,目前正在进行调试并发送给关键合作伙伴,预计将在2026年下半年开始量产[13] 市场影响与竞争定位 - 通过提供独立的Vera CPU,公司不仅能够为客户提供绕过传统x86架构瓶颈的替代方案,还能通过更低成本的选项吸引预算有限但希望获得高端CPU能力的客户[17] - 尽管部分云服务商正在自研加速器,但英伟达正通过在服务器CPU生态系统中加大投入,试图在下一代AI基础设施竞争中保持其核心地位[17] - 此次布局展示了公司在"后Blackwell时代"的雄心[5]
英伟达重磅布局“服务器CPU”,黄仁勋:将推出Vera CPU
华尔街见闻· 2026-01-27 11:07
公司战略与市场布局 - 英伟达正通过推出代号为"Vera"的全新CPU并首次将其作为独立产品推向市场,旨在消除AI供应链中的算力瓶颈,全面支持代理人工智能(Agentic AI)的发展,进一步巩固其在AI基础设施市场的统治地位 [1] - 公司此举意在解决服务器CPU已成为AI供应链主要瓶颈的问题,为客户提供更具成本效益的高端计算替代方案,使其不仅能在英伟达GPU上运行计算堆栈,也能在英伟达CPU上处理工作负载,这将对现有的服务器处理器市场格局产生直接影响 [1] - 这一战略不仅针对高端机架级解决方案,也开始向更广泛的通用计算市场渗透,试图构建一个全栈式的计算生态系统,展示了公司在"后Blackwell时代"的雄心 [2] 关键合作与投资 - 英伟达已承诺向新兴云服务商CoreWeave追加20亿美元投资,CoreWeave将成为首家部署Vera CPU作为独立基础设施选项的客户 [1][3] - 英伟达将以每股87.20美元的价格购买CoreWeave的A类普通股,这笔高达20亿美元的额外投资将直接支持CoreWeave的基础设施扩张,CoreWeave正计划在2030年前建设5吉瓦(GW)的AI工厂 [3] - 与以往通常将CPU作为整体超级芯片或机架系统一部分的销售策略不同,英伟达此次明确将提供Vera CPU作为基础设施的"独立部分",客户在构建计算堆栈时将拥有更大的灵活性 [3] 产品技术规格与性能 - Vera CPU基于下一代定制Arm架构,代号为"Olympus",配备了88个核心和176个线程,并引入了"空间多线程"技术 [4] - 在内存性能方面,Vera配备了1.5 TB的系统内存,是上一代Grace CPU的三倍,同时采用SOCAMM LPDDR5X技术,实现了1.2 TB/s的内存带宽 [4] - 通过NVLink-C2C互连技术,其相干内存互连速度高达1.8 TB/s,是Grace的两倍 [4] - 相比于Grace CPU,Vera在缓存设计上进行了大幅升级,每个核心拥有2MB的L2缓存(是Grace的两倍),以及162MB的共享L3缓存(提升了42%) [6] 产品平台与路线图 - Vera CPU是英伟达下一代Vera-Rubin平台的核心组件,该平台将Vera CPU与代号为"Rubin"的下一代GPU相结合 [6] - Rubin GPU预计将采用HBM4内存,带宽高达22 TB/s,是Blackwell GPU的2.75倍 [6] - 英伟达高性能计算和AI工厂解决方案高级总监透露,Vera-Rubin NVL72平台的核心芯片已从台积电返回,目前正在进行调试并发送给关键合作伙伴,预计将在2026年下半年开始量产 [6] 市场影响与客户拓展 - 通过提供独立的Vera CPU,英伟达能够为客户提供绕过传统x86架构瓶颈的"变通方案",并通过更低成本的选项吸引那些希望获得高端CPU能力但预算有限的客户 [7] - 除了CoreWeave,英伟达Vera-Rubin系统的早期客户名单还包括亚马逊AWS、谷歌Cloud、微软Azure、甲骨文Cloud Infrastructure等云巨头,以及Lambda、Nebius和Nscale等新兴玩家 [7] - 尽管部分云服务商正在自研加速器,但英伟达正通过在服务器CPU生态系统中"下重注",试图在下一代AI基础设施竞争中保持其不可撼动的核心地位 [7]
存储厂商,谨慎扩产
半导体芯闻· 2026-01-12 18:23
全球记忆体市场供需格局 - 人工智能基础设施建设进入白热化阶段,导致全球记忆体市场正经历一场前所未有的供应短缺周期 [1] - 尽管PC与智能手机制造商面临供应不足,但美光、三星及SK海力士等主要记忆体制造商罕见地保持极度克制,拒绝迅速提高产能 [1] - 摩根士丹利分析师将此现象描述为记忆体产业中世代级的供需失衡 [1] 需求驱动因素与增长预测 - 需求主要由全球科技大厂的资本支出驱动,亚马逊、Google、微软及Meta在2025年的合并资本支出高达4070亿美元,预计2026年将进一步攀升至5230亿美元 [2] - Bernstein分析师预计,未来四年NAND Flash快闪记忆体与HDD传统硬碟的总出货量年成长率将达到19%,远高于过去十年的平均水准14% [2] - 辉达与AMD加快了产品更新周期至每年一次,以辉达Rubin GPU为例,其记忆体频宽几乎是2025年Blackwell芯片的三倍,导致每台AI伺服器对DRAM的需求量以倍数成长 [2] 行业财务与市场表现 - 供应吃紧使记忆体厂商财报表现亮眼,美光上个月创下了单季销售额与营业利润的历史新高 [2] - 三星表示其第四季营业利益预计将较2024年同期成长三倍 [2] - 2025年,记忆体类股成为标普500指数中表现最出色的族群,美光、希捷与威腾电子的股价均翻了一倍以上 [3] - 从威腾电子分拆出来的Sandisk股价飙升了十倍,SK海力士股价在短短三个月内上涨了88% [3] 产能扩张的克制与历史教训 - 记忆体业者此次对扩产表现得极为谨慎,源于对过去剧烈价格波动导致亏损的深刻记忆 [3] - 2023年,由于产能过剩导致价格暴跌,美光、威腾电子、希捷及SK海力士全数陷入年度营业亏损 [3] - 目前仅希捷计划微幅增加资本支出,但也仅是维持在收入的4%左右 [3] 长期供应协议与价格展望 - Sandisk执行长公开呼吁,需求端应考虑签署超过三个月的长期供应协议,以提供长期经济保障,支持半导体设施建设 [4] - 分析师普遍认为,记忆体芯片与硬碟价格在2026年仍将维持高档 [4] - 如果需求保持强劲,此轮上升周期可能会持续多年 [4]
电子行业周报:NVIDIA宣布Rubin平台全面量产-20260112
爱建证券· 2026-01-12 16:35
报告行业投资评级 - 强于大市 [1] 报告的核心观点 - NVIDIA宣布Rubin平台全面量产,其训练性能是前代Blackwell的3.5倍,推理性能提升至5倍,标志着AI芯片领域的关键技术突破 [2][22] - AMD在CES 2026宣布数据中心芯片成功迈入2nm工艺时代,新一代AI加速器Instinct MI455单颗芯片晶体管数量达3200亿颗 [2][23][24] - 高算力GPU、CPU和高速连接芯片仍然是未来AI平台的发展方向,建议关注国产高算力GPU、CPU和连接芯片的投资机会 [2] 本周市场回顾 - **SW电子行业指数表现**:本周(2026/1/5-1/11)SW电子行业指数上涨7.74%,在31个SW一级行业中排名第7位,同期沪深300指数上涨2.79% [2][5] - **SW一级行业涨跌**:涨幅前五的行业分别为综合(+14.55%)、国防军工(+13.63%)、传媒(+13.10%)、有色金属(+8.56%)、计算机(+8.49%);涨幅后五的行业为银行(-1.90%)、交通运输(+0.23%)、石油石化(+0.29%)、农林牧渔(+0.98%)、通信(+1.66%)[2][5] - **SW电子三级行业表现**:涨幅前三的细分行业为电子化学品Ⅲ(+15.95%)、半导体材料(+15.90%)、半导体设备(+15.73%);涨幅后三的细分行业为品牌消费电子(+0.69%)、印制电路板(+1.40%)、消费电子零部件及组装(+3.59%)[2][9] - **SW电子个股表现**:涨幅前五的个股为臻镭科技(+48.18%)、珂玛科技(+42.68%)、可川科技(+41.14%)、普冉股份(+39.75%)、和林微纳(+39.39%);跌幅前五的个股为得润电子(-15.88%)、思泉新材(-9.74%)、安克创新(-7.16%)、睿能科技(-6.87%)、统联精密(-6.54%)[2][12] - **其他科技市场表现**: - 费城半导体指数(SOX)本周上涨3.68% [17] - 恒生科技指数本周下跌0.86% [17] - 中国台湾电子指数中,半导体板块上涨5.49%,电子板块上涨3.87%,电脑及周边设备板块下跌2.51% [18] 全球产业动态 - **NVIDIA Rubin平台量产**:2026年1月6日,NVIDIA宣布Rubin计算架构平台进入全面量产阶段,该平台由Vera CPU和Rubin GPU等六款新型芯片组成,新一代Vera CPU配备88个核心,专为高效能AI推理设计 [2][22] - **AMD推出2nm AI芯片**:2026年1月6日,AMD宣布其最新数据中心芯片迈入2nm时代,基于“共同设计”的Helios平台,新一代EPYC服务器CPU(代号Venice)基于Zen 6架构,单颗处理器最高可整合256个核心 [2][23][24] - **字节跳动AI眼镜规划**:字节跳动旗下豆包智能眼镜第一代产品总规划数量约为10万台,采用高通AR1芯片 [25] - **xAI完成巨额融资**:埃隆·马斯克旗下人工智能公司xAI于2026年1月6日宣布完成200亿美元首轮融资,资金将用于加速计算基础设施扩展,构建全球最大GPU集群 [2][26] - **天数智芯成功上市**:国产通用GPU公司天数智芯于2026年1月6日在港股成功上市,发行价144.60港元,首日收盘上涨8.39%,市值达398.77亿港元,截至2025年上半年共交付5.2万片GPU [27][28]
关注NVRubin升级:计算、网络、系统
华泰证券· 2026-01-12 15:27
报告行业投资评级 - 通信行业评级为“增持”(维持)[6] - 通信设备制造子行业评级为“增持”(维持)[6] 报告核心观点 - 英伟达在CES 2026发布新一代Rubin平台,在计算、网络和系统三个层面完成重大升级,随着Vera Rubin NVL72机柜导入市场,北美AI算力链有望迎来新一轮需求,建议关注光模块、铜连接、液冷等产业链[1][2][9] - 看好2026年通信行业“一主两副”投资主线:主线为AI算力链,副线1为核心资产,副线2为新质生产力(重点关注商业航天赛道)[3] 周专题:英伟达Rubin平台升级详情 计算层面升级 - **Rubin GPU**:推理性能提升至前代的5倍,训练性能提升至3.5倍[2][9];集成224个流式多处理器,配备第六代张量核心,采用双芯粒封装和台积电3纳米工艺[13];搭载288GB HBM4内存,内存带宽提升至22 TB/s,是前代Blackwell(8TB/s)的2.8倍[13];晶体管数量达到3360亿个,是Blackwell(2080亿个)的1.6倍[13][17];推理场景的每瓦性能将达到Blackwell的8倍[13] - **Vera CPU**:数据分析性能和压缩性能均为前代Grace CPU的2倍[2][9][10];基于Arm v9.2-A架构定制,每颗CPU搭载88颗Olympus核心,支持176线程[10];最高可搭载1.5TB LPDDR5X内存,是Grace CPU(480GB)的3倍以上[10];内存带宽最高达1.2TB/s,是Grace CPU(512GB/s)的2.3倍[13];通过NVLink-C2C与GPU互连带宽达1.8TB/s,是前代(900GB/s)的2倍[13][17] 网络层面升级 - **NVLink 6**:使GPU间互连带宽提升至3.6 TB/s(双向),较上代NVLink 5(1.8TB/s)翻倍[2][9][18];机柜内部总带宽达到260TB/s,是前代(130TB/s)的2倍[18];集成SHARP技术,在大型AI工作负载中可将All-Reduce通信流量减少高达50%,使张量并行执行时间缩短高达20%[18] - **Spectrum-6以太网交换机**:支持CPO(共封装光学)技术,交换芯片的交换容量达到102.4Tb/s,为前代的两倍[2][9][21];SN6800型号提供512个800G端口,总带宽达409.6 TB/s;SN6810提供128个800G端口,总带宽102.4 TB/s[21];采用CPO技术的交换机能效是传统同级别交换机的5倍,可靠性提升10倍[21] 系统层面升级 - **Vera Rubin NVL72机柜**:采用全液冷和全无缆模块化托盘设计[2][9];NVFP4推理算力为3.6 EFLOPS,训练算力为2.5 EFLOPS,分别较GB200 NVL72提升至5倍和3.5倍[2][9][33];配备54TB LPDDR5X内存(是GB200 NVL72的3倍)和20.7TB HBM4内存(是GB200 NVL72的1.5倍),HBM4内存带宽累计1.6 PB/s(是GB200 NVL72的2.8倍)[32][33];机架搭建时间从Blackwell时代的100分钟大幅缩减至仅6分钟[30] - **Vera Rubin超级芯片**:由2颗Rubin GPU与1颗Vera CPU组成,AI计算性能达到100 PFLOPS[25] 行业动态与数据 市场行情回顾 - 上周通信(申万)指数上涨1.66%,同期上证综指上涨3.82%,深证成指上涨4.40%[1][9] - 通信行业一周涨幅前十公司中,南京熊猫涨49.10%,通宇通讯涨42.34%,国博电子涨39.61%[7] - 一周跌幅前十公司中,*ST奥维跌13.57%,恒宝股份跌8.05%,剑桥科技跌7.96%[8] 其他行业新闻 - **5G**:公务机网络服务商Gogo完成5G ATG空对地连接测试,实现80Mbps下行速率和20Mbps上行速率[35] - **运营商集采**:中国铁塔电力电缆与漏泄电缆集采项目合计含税总额达12.67亿元[36];中国移动管理交换机集采,锐捷网络以1931.47万元(不含税)报价获70%份额,新华三以2444.96万元(不含税)报价获30%份额[37] - **云与AI**:台积电1.4nm工艺预计2027年启动风险性试产[38];三星计划在2026年使部署谷歌Gemini AI的移动设备数量翻番至8亿台[39];英伟达CEO黄仁勋称中国客户对H200需求“非常高”[40];SimilarWeb数据显示,2026年1月ChatGPT全球网页端流量份额降至64.5%,较2025年1月的86%下降约20个百分点,而Gemini份额升至21.5%[41] - **商业航天**:SpaceX计划在2026年底前将约4400颗卫星从550公里轨道降至480公里高度[42];国内首个海上回收复用火箭基地在浙江开工,总投资52亿元,建成后具备年产25发火箭能力[43];SpaceX计划大规模量产星舰飞船,年产量或高达10000枚[44] 重点公司观点与推荐 - 报告明确推荐AI算力链主线公司:中际旭创、新易盛、天孚通信、沃尔核材、锐捷网络、万国数据、奥飞数据[3] - 推荐核心资产主线公司:中国移动、亨通光电[3] - 重点关注新质生产力副线中的商业航天赛道[3] - 报告列出了九家重点推荐公司的目标价与投资评级,均为“买入”[6] - 沃尔核材目标价43.21元[6] - 奥飞数据目标价31.17元[6] - 中国移动目标价126.20元[6] - 新易盛目标价476.71元[6] - 锐捷网络目标价102.51元[6] - 万国数据-SW目标价45.83港元[6] - 中际旭创目标价626.68元[6] - 天孚通信目标价211.92元[6] - 亨通光电目标价25.73元[6]
英伟达六大芯片协同升级!芯片ETF(159995)上涨1.68%,龙芯中科涨9.52%
每日经济新闻· 2026-01-12 11:30
市场表现 - 2026年1月12日早盘,A股三大指数走势分化,上证指数盘中上涨0.25% [1] - 互联网、文化传媒、软件等板块涨幅靠前,摩托车、能源设备板块跌幅居前 [1] - 芯片科技股震荡走强,截至10点09分,芯片ETF(159995)上涨1.68% [1] - 芯片ETF(159995)成分股表现强劲,龙芯中科上涨9.52%,长电科技上涨7.09%,中微公司上涨6.77%,兆易创新上涨5.58%,晶盛机电上涨4.28% [1] 行业动态与技术创新 - 英伟达在CES 2026上正式发布Rubin平台,该平台由六款专为打造AI超级计算机而设计的全新芯片组成,包括Vera CPU、Rubin GPU、NVLink 6交换机、ConnectX-9 SuperNIC、BlueField-4 DPU和NVIDIA Spectrum-6以太网交换机 [3] - Rubin平台的六款芯片采用协同设计,旨在大幅缩短AI训练时间并降低推理token成本 [3] - 信达证券认为,英伟达Rubin平台的发布开启了AI算力新纪元,标志着全球算力设施向“AI工厂”范式全面转型 [3] - 通过协同设计实现性能飞跃,Rubin平台有望带动算力、存储、PCB、机架等多个产业链环节的价值量显著提升 [3] - 在基建投资化趋势下,产业链核心环节仍具备较大的成长空间 [3] 相关金融产品 - 芯片ETF(159995)跟踪国证芯片指数,其30只成分股集合了A股芯片产业中材料、设备、设计、制造、封装和测试等环节的龙头企业 [3] - 成分股示例包括中芯国际、寒武纪、长电科技、北方华创等 [3] - 该ETF的场外联接基金代码为A类:008887;C类:008888 [3]
机构:存力+算力量价齐升,半导体设备进入主升阶段,半导体设备ETF(561980)高开上涨1.15%!
搜狐财经· 2026-01-12 10:33
文章核心观点 - AI需求与国产替代双重驱动,全球半导体行业持续走强,上游半导体设备与材料领域的投资确定性凸显 [1][4][7] 半导体设备市场表现与资金动向 - 2026年1月12日早盘,半导体设备ETF高开上涨1.15%,且近期连续2个交易日获资金净流入近1亿元 [1] - 半导体设备ETF跟踪的中证半导指数年内涨幅超15%,领先主流半导体指数 [2] - 指数权重股表现强劲:中微公司涨近4%,寒武纪、长川科技涨超3%,北方华创、华海清科跟涨;成份股江化微涨超5%,雅克科技、安集科技、中科飞测等多股涨超2% [2] AI算力与存储需求驱动 - 算力方面:英伟达全新AI芯片架构Vera Rubin亮相,其核心Rubin GPU的推理性能达到上一代Blackwell平台的5倍,新存储架构扩张存储需求 [5] - 存力方面:国际存储巨头计划大幅涨价,三星电子与SK海力士计划在2026年第一季度将服务器DRAM价格较2025年第四季度提升60%至70% [5] - 存储供应紧张:闪迪要求部分客户支付100%现金预付款,以锁定未来1至3年的存储芯片配额 [5] - AI数据中心推动存储升级,尤其带动高带宽存储出货量快速提升,因其制程与封装更复杂,单位比特晶圆面积消耗显著高于传统DRAM,从而抬升相关半导体材料消耗 [6] 半导体材料市场与国产替代 - 全球半导体材料市场规模预计2025年约700亿美元,同比增长6%,预计2029年将超过870亿美元 [6] - 中国大陆关键半导体材料市场规模预计2025年达1741亿元,同比增长21.1% [6] - 国产替代进程推进:2026年1月7日,相关部门决定对原产于日本的二氯二氢硅发起反倾销立案调查,该产品是芯片制造薄膜沉积环节的重要电子化学材料 [5] - 在安全博弈升温背景下,国内对关键半导体材料的“供应安全+国产替代”逻辑边际强化,高端材料领域具备技术、产能及客户绑定优势的头部企业有望实现份额与盈利增长 [7] 半导体产业链投资布局 - 半导体设备ETF重点布局半导体产业链上中游高壁垒领域,前十大权重股集中度接近80% [7] - ETF覆盖设备、材料、芯片设计三大行业,合计占比超90%,国产替代空间广阔 [7] - 具体覆盖细分龙头包括中微公司、北方华创、中芯国际、海光信息、寒武纪、南大光电等 [7]
CES2026:英伟达六大芯片协同升级,算力+存力迈入新纪元
信达证券· 2026-01-11 23:04
行业投资评级 - 看好 [2] 报告核心观点 - 英伟达在CES 2026正式发布Rubin平台,标志着AI算力进入新纪元,全球算力设施向“AI工厂”范式全面转型 [2][3] - Rubin平台通过六大芯片的协同设计,实现了推理性能的大幅提升和成本的显著下降 [2][7] - 报告认为,Rubin平台的升级将带动算力、存储、PCB、机架等多个产业链环节价值量显著提升,相关核心环节在基建投资化趋势下具备较大成长空间 [3][39] 根据相关目录分别总结 Vera Rubin:六大芯片协同升级,推理性能大幅提升 - 英伟达于CES 2026发布Rubin平台,该平台由Vera CPU、Rubin GPU、NVLink 6交换机、ConnectX-9 SuperNIC、BlueField-4 DPU和NVIDIA Spectrum-6以太网交换机六款全新芯片组成,通过协同设计旨在大幅缩短训练时间并降低推理token成本 [2][7] - 平台的旗舰产品是Vera Rubin NVL72机架级系统,其设计目标是实现可预测的延迟、高利用率及高效的电力转化 [7] 算力:NVFP4推理性能提升5倍,推理成本显著下降 - Vera CPU拥有88个定制Olympus核心,系统内存达1.5TB,是Grace CPU的3倍,数据处理性能翻倍提升 [12] - Rubin GPU引入Transformer引擎,其NVFP4推理性能高达50 PFLOPS,是Blackwell GPU的5倍;NVFP4训练性能达到35 PFLOPS,是Blackwell的3.5倍 [2][13] 存储:针对大量KV Cache问题,推出推理上下文内存存储平台 - Rubin GPU集成新一代HBM4,每个GPU最高配备288GB,总内存带宽提升至22 TB/s,是Blackwell的2.8倍 [14][20] - 每个Vera CPU搭载最高1.5TB的LPDDR5X内存,带宽达1.2 TB/s,并通过第二代NVLink-C2C与GPU实现1.8 TB/s的一致性带宽,形成统一内存池 [17] - 平台引入由BlueField-4 DPU驱动的NVIDIA推理上下文内存存储,用于存储KV Cache,该架构可将每秒tokens数提升高达5倍,并实现高达5倍的能效提升 [2][18] - 每个存储节点配置4个BlueField-4 DPU,每个DPU背后有150TB上下文NAND,分配到每块GPU上额外获得16TB NAND,带宽保持200 Gbps [18] PCB:从Cable Tray到Cableless互联,PCB价值量显著提升 - Rubin NVL72采用cableless无缆互联架构,通过PCB板直接传输信号,取代了上一代Blackwell NVL72的复杂线缆连接 [22] - 这种机械简化使组装速度比上一代托盘架构快18倍,并显著缩短了现场维护服务时间,降低了部署和运营成本 [2][22] Rack:系统协同设计显著提升,ODM环节核心受益 - NVIDIA DGX SuperPOD作为大规模AI工厂部署蓝图,采用8套DGX Vera Rubin NVL72系统,并通过极致协同设计大幅降低训练与推理成本 [25] - 与上一代Blackwell相比,训练相同规模的MoE模型仅需1/4的GPU数量;在相同延迟下,大型MoE模型的token成本降低至1/10 [25] 开源模型:从数据到代码全覆盖,Nemotron 3重构Agentic AI范式 - 英伟达扩展其开源模型生态,覆盖生物医学AI、AI物理模拟、Agentic AI、物理AI、机器人和自动驾驶六大领域 [2][29] - Nemotron系列是更新重点,覆盖推理、RAG、安全和语音四个应用方向,提供了包括小型化推理模型、强化学习工具、向量嵌入模型、内容安全模型及语音处理库等一系列工具 [2][32] 物理AI:从Cosmos到Alpamayo,走向商业化落地 - 在物理AI领域,英伟达更新了视频理解与生成模型Cosmos、机器人基础模型Isaac GR00T以及自动驾驶视觉-语言-行动模型Alpamayo [2][33] - Cosmos是一个开源的世界基础模型,能用海量视频、驾驶与机器人数据及3D模拟进行预训练,具备生成内容、推理和预测轨迹等能力 [33] - Alpamayo是面向自动驾驶领域的开源工具链,也是首个开源的视觉-语言-行动推理模型,其突破在于引入了“推理”能力,能理解复杂场景的因果关系并做出多步决策 [34] 投资建议 - 报告建议关注四大方向的投资机会 [3][40] - 海外AI产业链:包括工业富联、沪电股份、鹏鼎控股、胜宏科技、生益科技、生益电子等 [40] - 国产AI产业链:包括寒武纪、芯原股份、海光信息、中芯国际、深南电路等 [40] - 存储产业链:包括德明利、江波龙、兆易创新、聚辰股份、普冉股份等 [40] - SoC产业链:包括瑞芯微、乐鑫科技、恒玄科技、晶晨股份、中科蓝讯等 [40]
行业点评报告:VeraRubinNVL72推出,六芯协同架构重塑AI算力基建
开源证券· 2026-01-11 22:42
行业投资评级 - 投资评级:看好(维持)[1] 核心观点 - 英伟达(NVIDIA)在CES 2026上推出Rubin AI平台及Rubin NVL72机柜级解决方案,通过六芯协同设计实现性能飞跃与成本降低,重塑AI算力基础设施[4][5] - Rubin NVL72的创新趋势呈现五大核心方向:极致带宽、易维护性、高效扩展性、深度协同和安全性,将驱动产业链相关环节升级[6] 技术创新与架构细节 - **六芯协同设计**:平台通过对Vera CPU、Rubin GPU、NVLink6交换机、ConnectX9 SuperNIC、BlueField4 DPU和Spectrum 6以太网交换机进行极致协同设计,大幅缩短训练时间并降低推理token成本[4] - **系统配置**:Rubin NVL72整合18个计算托盘与9个NVLink 6交换托盘,每个计算托盘集成2个Vera CPU与4块Rubin GPU的Superchip,系统总计包含72个GPU与36个CPU[5] - **极致带宽**:计算层通过NVLink-C2C实现CPU-GPU互联带宽达1.8TB/s,HBM4显存为单GPU提供288GB容量与22TB/s带宽,第六代NVLink技术使单GPU带宽和机柜总带宽均实现翻倍[5][6] - **无缆化与易维护**:采用Cable-Free无缆托盘与高密度Midplane背板设计,支持热插拔,可在系统运行时直接更换故障组件,大幅提升装配及维护效率[6] - **高效扩展性**:网络层以NVLink 6交换机达成GPU间3.6TB/s全互联(Scale-up),结合采用CPO(共封装光学)技术的Spectrum-X交换机(512×200Gbps)实现横向扩展(Scale-out),显著提升能效[5][6] - **深度互联与存储**:CPU与GPU通过NVLink-C2C实现超高速互联,消除PCIe总线带宽瓶颈,BlueField-4 DPU集成150TB NAND上下文存储池,为每GPU分配16TB存储[5][6] - **辅助系统**:采用全覆盖液冷系统,并集成机架级机密计算与RAS(可靠性、可用性、可服务性)引擎[5] 产业链受益标的 - **整机组装**:工业富联[7] - **连接器**:立讯精密、汇聚科技、瑞可达等[7] - **PCB**:胜宏科技、沪电股份、生益科技、景旺电子等[7] - **散热**:英维克、领益智造、蓝思科技、思泉新材、中石科技[7] - **电源**:欧陆通、奥海科技[7]
行业周报:英伟达全新存储架构扩张存储需求,半导体上游国产化持续-20260111
开源证券· 2026-01-11 18:43
行业投资评级 - 投资评级:看好(维持) [2] 报告核心观点 - 英伟达全新AI芯片架构Vera Rubin及存储架构显著扩张AI算力与存储需求,叠加半导体上游持续涨价,驱动行业景气上行 [5][6] - AI终端升级政策与厂商计划加速落地,进一步拉动产业链需求 [5] - 国内半导体上游国产化进程持续,部分环节存在涨价行情,相关产业链公司受益 [4][6] 市场回顾 - 本周(2026.1.05-2026.1.11)电子行业指数上涨3.83%,半导体板块上涨4.80%,其中半导体设备子板块上涨12.24%,存储器子板块上涨10.77% [4] - 海外科技股上涨,纳斯达克指数本周上涨1.63%,SK海力士股价上涨9.90%,美光股价上涨9.41%,闪迪股价上涨37.12% [4] 行业动态:终端 - 工业和信息化部等八部门印发《“人工智能+制造”专项行动实施意见》,支持端侧模型等技术突破,培育智能手机、电脑等人工智能终端 [5] - 三星电子计划在2026年将支持谷歌Gemini AI功能的移动设备数量从2025年的4亿台提升至8亿台 [5] 行业动态:算力 - 英伟达在CES 2026发布全新AI芯片架构Vera Rubin,其核心Rubin GPU的推理性能达到上一代Blackwell平台的5倍 [5] - Vera Rubin平台包含六款核心芯片,采用全新液冷设计以提升集成度并缩短组装时间 [5] 行业动态:存力 - 英伟达提出全新存储架构,通过BlueField-4为推理平台提供支持,在每个GPU原有1TB内存的基础上额外增加16TB内存 [6] - 三星电子与SK海力士计划在2026年第一季度将服务器DRAM价格较2025年第四季度提升60%至70%,并向个人电脑与智能手机DRAM客户提出相近幅度的涨价方案 [6] 行业动态:AI基座 - 商务部决定自2026年1月7日起,对原产于日本的进口二氯二氢硅进行反倾销立案调查 [6] 投资建议 - AI持续拉动存储需求,半导体上游fab、封测等均存在涨价行情 [6] - 受益标的包括:中芯国际、华虹半导体、甬矽电子、华峰测控、海光信息、寒武纪、芯原股份等 [6]