Workflow
LPU芯片
icon
搜索文档
智微智能(001339) - 2026年4月24日投资者关系活动记录表
2026-04-24 19:12
证券代码:001339 证券简称:智微智能 深圳市智微智能科技股份有限公司 投资者活动记录表 编号:2026-003 投资者关系活动类别 □特定对象调研 □分析师会议 □媒体采访 □业绩说明会 □新闻发布会 □路演活动 □现场参观 ☑其他(线上会议) 参与单位名称及 人员姓名 红杉资本闫慧辰、招商基金文仲阳、宝盈基金容志能、太平 养老陈宁玉、国联基金焦阳、银华基金刘宇尘、鹏华基金张 卓然、太保资产陶韫琦、人保资产利铮、建信养老金高月、 银河基金田萌、泉果基金姜荷泽、建信理财傅浩、前海人寿 刘远程、富荣基金郎骋成、贝莱德机构信托神玉飞、富兰克 林华美投信李昀修、国信计算机艾宪、中信证券潘儒琛、国 盛证券王心悦、国盛证券孙行臻、华创证券孙元、金元证券 王鑫旸、国投证券王永彬、红土创新侯世霞、国源信达李明 书、华泰证券王浩天、中邮证券王思、财通证券周勃宇、勤 辰资产林玲、中信保诚杨柳青、浙商证券刘雯蜀、申万宏源 崔航等 112 家机构参会人员。 时 间 2026/4/24 15:00 地 点 线上会议 上市公司接待 人员姓名 智微智能董事会秘书 张新媛 智微智能财务总监 李敏 智微智能IRD 汪伟杰 投资者关系活动 ...
谁来为端侧大模型“功耗墙”破局?
是说芯语· 2026-04-23 08:22
文章核心观点 - 2025年是“端侧AI元年”,全球端侧AI市场预计从2025年的3219亿元增长至2029年的1.2万亿元,复合年增长率达39.6%,催生了对低功耗、高性能端侧AI芯片的海量需求 [1] - 行业面临三大核心痛点:1)“功耗-算力-成本”的不可能三角;2)“内存墙”难题突出,带宽利用率普遍不足50%;3)场景适配的矛盾 [1][2] - 当前主流技术路径(传统GPU/NPU架构和常规TPU/ASIC架构)均存在局限,导致行业陷入“两难困境”:要么高功耗、高算力、高成本,要么低功耗、低算力、场景窄 [3][4][6] - 深圳初创企业迈特芯通过技术、模式、定位三重创新,依托3D分布式TPU技术(LPU路线)、类矿机可扩展模式和聚焦“龙虾终端”的场景定位,为行业提供了差异化的破局路径 [7][8][21][24] 行业机遇与痛点总结 - **市场机遇**:全球端侧AI市场预计从2025年的3219亿元增长至2029年的1.2万亿元,复合年增长率高达39.6% [1] - **核心痛点一:不可能三角**:端侧终端对功耗要求严苛(通常5W以内),但运行7B以上全量级大模型需要高算力,导致功耗、算力、成本难以平衡 [1] - **核心痛点二:内存墙**:传统平面IO设计导致计算单元与内存间数据搬运能耗高、效率低,带宽利用率普遍不足50%,制约推理速度并推高功耗 [2] - **核心痛点三:场景适配矛盾**:产品要么追求全场景覆盖导致泛化,要么局限于单一场景导致市场覆盖面窄,难以适配“多场景融合”趋势及开源智能体的新要求 [2] 主流技术路径分化与局限 - **路径一:传统GPU/NPU架构** - 主导企业为国际巨头(如Arm、英伟达) [4] - 核心优势:技术成熟,算力强劲,可稳定运行大模型 [4] - 核心短板:功耗高(10W以上,Arm AGI CPU-1达300W)、生态封闭、成本高、依赖海外IP [4] - **路径二:常规TPU/ASIC架构** - 主导企业为国内多数同行 [4] - 核心优势:功耗较低(5W左右)、适配小型终端、成本适中 [4][6] - 核心短板:算力不足(多局限于4B以下模型)、内存墙未解决、场景适配单一、国产化不足 [4][6] - **行业困境**:两条主流路径导致“两难困境”——要么高功耗、高算力、高成本,要么低功耗、低算力、场景窄 [6] 迈特芯的破局之道:三重创新 - **技术创新:3D分布式TPU与LPU技术路线** - 核心技术为3D分布式TPU,是LPU技术路线的底层核心架构 [7][8] - 采用立方脉动架构与3D分布式IO(3D-DRAM近存计算)深度融合,已通过全国产28nm工艺流片 [8] - **产品性能亮点**(基于LPU技术路线): - LPU base:功耗5W,带宽400GBps,带宽利用率≥75%,推理速度80 TPS,词元能效16 TPS/W,适配2-4B模型 [10] - LPU pro:功耗10W,带宽600GBps,带宽利用率≥75%,推理速度80 TPS,词元能效8 TPS/W,适配9B模型 [10] - LPU pro+:功耗40W,带宽2400GBps,带宽利用率≥75%,推理速度135 TPS,词元能效3.38 TPS/W,适配27-35B模型 [10] - **技术价值体现**: - 彻底解决“内存墙”:带宽利用率提升至80%左右,远超国内同行50%以下的平均水平 [10][11] - 实现能效比跨越式提升:5W可稳定运行2-9B模型,性能媲美高端芯片,功耗降低一个量级 [12] - 国产化落地领先:核心架构、IP全自研,基于全国产工艺,已完成Qwen、GLM、miniCPM等主流开源大模型部署 [12] - **模式创新:类矿机可扩展模式** - 核心逻辑是模块化设计,借鉴矿机可堆叠、可扩展特性 [21][23] - 让LPU系列产品(单芯片、推理卡、类矿机)能根据场景需求灵活调整算力规模,实现“灵活适配+成本优化” [23] - 与3D分布式TPU低功耗特性深度协同,打破“一款芯片对应一个场景”的固有模式 [23] - **定位创新:聚焦“龙虾终端”** - 核心是适配开源AI智能体“龙虾”(OpenClaw)的本地化运行需求 [24][25] - 为龙虾智能体提供低功耗、高性能的本地算力支撑,并通过可扩展模式适配其在不同终端场景的算力需求 [25] - 优势在于“精准性与扩展性的平衡”,避免了国际巨头的泛化问题和国内同行的单一场景局限 [26] - 已与麒麟软件、全志科技等上下游企业展开生态联合 [26] 迈特芯产品矩阵与规划 - **主打产品系列**: - LPU base系列:聚焦AI pad等消费电子终端,平均功耗5W,推理速度大于80 Token/s [27] - LPU pro系列:聚焦机械臂、工业控制场景,提供轻量化、低成本的本地推理解决方案 [27] - LPU pro+系列:侧重边缘NAS盒子、PC及token工厂等场景,提供高性能低成本解决方案 [27] - **推理芯片产品矩阵**: - Base系列(MC_mega_188):3D DRAM容量2.5GB,适配0.5B-3B模型 [16] - Pro系列(MC_mega_288/488):3D DRAM容量5GB/10GB,适配4B-9B模型 [17] - Pro+系列(4芯片MC_mega_488):3D DRAM容量40GB,适配27B/35B模型 [18] - Pro Max系列(8芯片MC_mega_488):3D DRAM容量80GB,适配122B模型 [19] - **公司发展里程碑**: - 2023年:ASIC投片验证TPU [31] - 2024年:FPGA原型机验证分布式IO大模型 [31] - 2025年:全国产3D工艺设计 [31] - 2026年:流片量产3D分布式TPU芯片及推理卡,计划年底实现样片量产 [31] - 2027年:计划大规模落地,并持续迭代14nm/7nm工艺 [31] 竞争格局与迈特芯差异化优势 - **竞争格局**: - 国际巨头(如英伟达、高通):在高端市场占主导,但存在功耗高(英伟达)或架构传统、能效比不及LPU(高通)的短板 [29] - 国内同行:多采用常规2D IO或传统NoC路线,架构利用率低、功耗高、难扩展,或无法解决3D堆叠散热问题 [29] - **迈特芯协同优势**: - 技术优势:LPU路线依托3D分布式TPU架构,在带宽利用率、能效比、推理速度上达到国际先进水平,且基于全国产工艺 [30] - 模式优势:类矿机可扩展模式解决了规模化落地难题 [30] - 定位优势:聚焦龙虾终端实现了场景的精准适配 [30] - 形成“技术-模式-定位”三者协同的壁垒,区别于国际巨头和国内同行的局限 [30]
英伟达引爆算力芯片概念,英特尔年内狂飙85%,超威半导体连涨12天创新高
21世纪经济报道· 2026-04-17 18:54
全球算力芯片板块近期表现 - 截至4月16日美股收盘,超威半导体(AMD)连涨12天股价创历史新高,日内大涨7.8%,年初至今涨幅近30% [1][13] - 英特尔4月以来也连日上涨,年内股价累计上涨超85% [1][13] - 英伟达收盘微跌0.26%,但此前已连续11个交易日上涨,总市值回升到4.8万亿美元 [1][13] - 国内市场4月16日当天,壁仞科技涨超26%并已连涨7天,天数智芯涨逾17%,沐曦股份涨超8% [2][14] 板块上涨的直接催化因素 - 上涨归因于业绩确认和预期强化的共振效应,头部科技公司最新财报中数据中心与AI相关业务的收入与订单显著超出市场预期 [4][16] - 英伟达数据中心业务已成为全球AI基础设施的定价锚,大型云厂商和新兴AI公司对高端GPU需求依旧强劲 [5][17] - 英伟达近期通过投资上下游扩大AI算力版图,包括对Marvell投资20亿美元,以及入股RISC-V处理器IP厂商SiFive [5][17] - 从资金面看,被动资金与ETF的配置起到放大作用,相关指数基金持续流入推高板块整体估值 [6][18] 核心公司动态与市场观点 - TrendForce集邦咨询预估,由于AI需求强劲,2026年NVIDIA高端GPU出货量将明显增长,但年增率从原本预估约26.8%微幅下修至近26% [4][16] - 英特尔的上涨更具估值修复意味,随着AI PC概念升温及先进制程推进,公司在AI时代的角色被重新评估 [5][17] - 半导体分析机构SemiAnalysis指出,CPU正面临极其严重的产能短缺 [5][17] - IDC数据显示,2025年全球服务器出货量同比增长15%,其中加速服务器同比增长29%,通用服务器同比增长13% [6][18] AI产业需求结构的关键转变 - AI产业正从“训练驱动”走向“推理驱动”,算力需求呈现持续化、规模化的新特征 [2][14] - 与早期一次性、大规模的训练投入不同,推理环节更接近持续调用模式,带来稳定且长期的算力消耗 [9][20] - 这一转变使算力需求转向“类基础设施消耗”,算力逐渐演变为类似电力、带宽的长期生产要素,是市场给予算力芯片更高估值的重要原因之一 [10][20] 厂商战略布局与行业风向标 - 英伟达在今年GTC上发布主打提升推理效率的LPU芯片,集邦咨询预估其全新LPU的市场需求2026年有望达数十万张,2027年目标为翻倍增长 [11][21] - 英特尔与谷歌宣布合作,共同推进下一代AI和云基础设施发展,以强化CPU和IPU在异构AI系统中的作用 [11][21] - 亚马逊、微软、谷歌、Meta等全球科技巨头在AI相关领域的投入仍在持续扩大,整体规模已达数千亿美元级别 [11][21] - 算力红利正从单一芯片厂商向更广泛环节扩散,高带宽内存(HBM)、先进封装及上游设备材料厂商获得更高关注度 [11][21] 市场核心逻辑与未来焦点 - 市场对算力芯片的定价逻辑正在从周期波动转向长期供需重估 [2][14] - 本轮算力芯片上涨是对AI资本开支周期与需求结构变化的再确认,而非简单的市场反弹 [12][22] - 市场的核心分歧正在从“AI是否增长”转向“增长的质量与持续性”,围绕资本开支可持续性、估值水平及产业链利润分配的分歧将决定行情的持续时间与演绎路径 [11][12][21][22]
英伟达引爆算力芯片概念,英特尔年内狂飙85%,超威半导体连涨12天创新高
21世纪经济报道· 2026-04-17 18:43
全球算力芯片板块近期表现 - 全球算力芯片板块在经历年初波动后再度走强,相关公司股价表现强劲 [1] - 截至4月16日美股收盘,超威半导体(AMD)连涨12天创历史新高,日内大涨7.8%,年初至今涨幅近30% [1] - 英特尔4月以来连日上涨,年内股价累计上涨超85% [1] - 英伟达总市值回升到4.8万亿美元 [1] - 国内市场也掀起上涨潮,4月16日壁仞科技涨超26%连涨7天,天数智芯涨逾17%,沐曦股份涨超8% [3] 上涨的驱动因素 - 本轮上涨的直接催化因素是业绩确认和预期强化的共振效应 [5] - 头部科技公司在最新财报季中持续释放积极信号,数据中心与AI相关业务的收入与订单显著超出市场预期 [5] - 从资金面看,被动资金与ETF的配置起到放大作用,科技股权重回升推动指数基金持续流入 [10] - 在宏观不确定性背景下,盈利确定性更强的AI资产成为资金的重要配置方向 [10] 行业需求的结构性变化 - AI产业正从“训练驱动”走向“推理驱动”,算力需求呈现持续化、规模化的新特征 [3] - 市场对算力芯片的定价逻辑正在从周期波动转向长期供需重估 [3] - 推理环节更接近持续调用模式,带来稳定且长期的算力消耗,使算力需求转向“类基础设施消耗” [15] - 2025年全球服务器出货量预计同比增长15%,其中加速服务器同比增长29%,通用服务器同比增长13% [10] - AI训练工作负载造成DRAM短缺,推理工作负载则推动了CPU的需求 [10] 主要公司的动态与表现 - 英伟达的数据中心业务已成为全球AI基础设施的定价锚,高端GPU需求依旧强劲 [9] - 集邦咨询预估,由于AI需求强劲,2026年英伟达高端GPU出货量年增率从原本预估约26.8%微幅下修至近26% [5] - 英伟达近期投资美满电子(Marvell)20亿美元,并入股RISC-V处理器IP厂商SiFive,扩大AI算力版图 [9] - 英伟达发布LPU芯片主打提升推理效率,预估其全新LPU的市场需求2026年有望达数十万张,2027年目标翻倍增长 [15] - 英特尔的上涨更具估值修复意味,随着AI PC概念升温及先进制程推进,公司在AI时代的角色被重新评估 [9] - 半导体分析机构指出,CPU正面临极其严重的产能短缺 [9] - 英特尔与谷歌宣布合作,共同推进下一代AI和云基础设施,强化CPU和IPU的作用 [15] - 根据集邦咨询数据,2025年全球前十大IC设计公司营收总计3594.32亿美元,同比增长44% [12] - 英伟达2025年营收达2057.32亿美元,同比增长65.0%,在前十大公司中的营收份额从2024年的50%提升至57% [12] - 超威半导体(AMD)2025年营收346.39亿美元,同比增长34.0% [12] - 美满电子(Marvell)2025年营收80.61亿美元,同比增长43.0% [12] 产业链与未来趋势 - 算力红利正在从单一芯片厂商向更广泛环节扩散,高带宽内存(HBM)、先进封装及上游设备材料厂商获得更高关注度 [16] - 全球科技巨头(如亚马逊、微软、谷歌、Meta)在AI相关领域的资本开支持续扩大,整体规模达数千亿美元级别 [16] - 市场的核心分歧正从“AI是否增长”转向“增长的质量与持续性”,高强度的资本开支能否持续转化为商业回报存在不确定性 [16] - 分析师普遍判断,本轮算力芯片上涨是对AI资本开支周期与需求结构变化的再确认,而非简单的市场反弹 [16]
英伟达带火算力芯片 产业链迎来系统性重估
21世纪经济报道· 2026-04-17 07:42AI 处理中...
全球算力芯片板块表现强劲 - 全球算力芯片板块在经历年初波动后近期再度走强,英伟达股价连续11个交易日上涨,总市值回升至4.8万亿美元,AMD同样连涨11天,年初至今股价涨幅超过20%,英特尔在9个交易日连涨后,2026年以来股价累计上涨超75% [1] - 国内市场同样掀起上涨潮,4月16日当天壁仞科技涨幅超26%且已连涨7天,天数智芯涨逾17%,沐曦股份涨超8% [2] - 龙头企业股价连续上涨带动半导体及AI基础设施相关资产整体回暖,表面由业绩预期修复与资金回流共同驱动 [2] 上涨的驱动因素 - 本轮上涨的直接催化因素是业绩确认和预期强化的共振效应,头部科技公司最新财报在数据中心与AI相关业务上的收入与订单显著超出市场预期,强化了投资者对算力需求韧性的判断 [2] - 英伟达数据中心业务已成为全球AI基础设施的定价锚,大型云厂商和新兴AI公司对高端GPU的需求依旧强劲 [3] - 从资金面看,被动资金与ETF的配置起到放大作用,随着科技股权重回升,相关指数基金持续流入,推高板块整体估值水平,盈利确定性更强的AI资产成为资金重要配置方向 [4] 行业需求结构发生根本转变 - AI产业正从“训练驱动”走向“推理驱动”,算力需求呈现持续化、规模化的新特征,市场对算力芯片的定价逻辑正从周期波动转向长期供需重估 [2] - 推理环节更接近持续调用模式,企业部署大模型及各类AI Agent落地会带来稳定且长期的算力消耗,使算力需求转向“类基础设施消耗”,成为类似电力、带宽的长期生产要素 [5] - 2025年全球服务器出货量同比增长15%,其中加速服务器同比增长29%,通用服务器同比增长13%,AI训练工作负载造成DRAM短缺,推理工作负载则推动了CPU需求 [4] 主要公司的动态与布局 - 英伟达因AI需求强劲且积极推动芯片用量高的整合型GB/VR机柜方案,TrendForce预估其2026年高端GPU出货量将明显增长,但年增率从原本预估约26.8%微幅下修至近26% [2] - 英伟达新一代架构产品的推出被视为打开下一轮增长空间的重要变量,公司近期通过投资上下游扩大AI算力版图,包括对Marvell投资20亿美元,以及入股RISC-V处理器IP厂商SiFive [3] - 英伟达在GTC上发布主打提升推理效率的LPU芯片,集邦咨询预估其全新LPU的市场需求2026年有望达数十万张,2027年目标为翻倍增长 [6] - 英特尔的上涨更具估值修复意味,随着AI PC概念升温、先进制程推进以及智能体演进使CPU成为新的AI瓶颈,公司在AI时代的角色被重新评估,半导体分析机构指出CPU正面临极其严重的产能短缺 [3] - 英特尔与谷歌近日宣布合作,共同推进下一代AI和云基础设施发展,以强化CPU和IPU在扩展现代异构AI系统中的关键作用 [6] 产业链与资本开支趋势 - 算力红利正从单一芯片厂商向更广泛环节扩散,高带宽内存、先进封装以及上游设备材料厂商在本轮周期中获得更高关注度 [6] - 全球科技巨头如亚马逊、微软、谷歌、Meta在AI相关领域的资本开支持续扩大,整体规模已达数千亿美元级别 [6] - 市场的核心分歧正从“AI是否增长”转向“增长的质量与持续性”,部分分析认为高强度的资本投入能否持续转化为商业回报仍存在不确定性 [6] 行业整体判断 - 分析师普遍判断本轮算力芯片上涨并非简单的市场反弹,而是对AI资本开支周期与需求结构变化的再确认 [7] - 围绕资本开支可持续性、估值水平以及产业链利润分配的分歧,将决定此轮行情的持续时间与演绎路径 [7]
英伟达带火 算力芯片 产业链迎来系统性重估
21世纪经济报道· 2026-04-17 01:15
全球算力芯片板块近期表现 - 全球算力芯片板块在经历年初波动后再度走强,龙头企业股价连续上涨带动半导体及AI基础设施相关资产整体回暖 [1] - 截至4月16日,英伟达股价连续第11个交易日上涨,总市值回升到4.8万亿美元;AMD同样连涨11天,年初至今股价涨超20%;英特尔9个交易日连涨,2026年以来股价累计上涨超75% [1] - 国内市场也掀起上涨潮,4月16日当天壁仞科技涨超26%,已连涨7天;天数智芯涨逾17%,沐曦股份涨超8% [1] 股价上涨的直接催化因素 - 本轮上涨归因于业绩确认和预期强化的共振效应,头部科技公司在最新财报季中持续释放积极信号,尤其是在数据中心与AI相关业务上,收入与订单均显著超出市场预期 [2] - 英伟达的数据中心业务已成为全球AI基础设施的定价锚,无论是大型云厂商还是新兴AI公司,对高端GPU的需求依旧强劲 [2] - 英伟达近期通过投资上下游来扩大AI算力版图,先对Marvell(美满电子)投资20亿美元,又入股RISC-V处理器IP厂商SiFive [2] - 从资金面看,被动资金与ETF的配置起到放大作用,随着科技股权重回升,相关指数基金持续流入,进一步推高板块整体估值水平 [3] 英伟达与GPU市场动态 - TrendForce集邦咨询表示,由于AI需求强劲,且英伟达积极推动芯片用量高的整合型GB/VR机柜方案,预估2026年英伟达高端GPU出货量将明显增长,然而年增率将从原本预估约26.8%,微幅下修至近26% [2] - 公司新一代架构产品的推出,被视为打开下一轮增长空间的重要变量 [2] - 英伟达在今年GTC上发布LPU芯片,主打提升推理效率,集邦咨询预估其全新LPU的市场需求2026年有望达数十万张,2027年目标则为翻倍增长 [5] 英特尔与CPU市场动态 - 英特尔的上涨更具估值修复意味,随着AI PC概念升温以及先进制程推进,公司在AI时代的角色正在重新被评估 [3] - 随着智能体演进,CPU成为新的AI瓶颈,回到AI视野中心,半导体分析机构SemiAnalysis首席分析师Dylan Patel表示,CPU正面临极其严重的产能短缺 [3] - 英特尔与谷歌近日宣布合作,双方将共同推进下一代AI和云基础设施的发展,从而进一步强化CPU和IPU在扩展现代异构AI系统中的关键作用 [5] AI产业需求结构转变 - AI产业正从"训练驱动"走向"推理驱动",算力需求开始呈现持续化、规模化的新特征 [1] - 当前业内的共识是,AI产业正在从以模型训练为核心的第一阶段,迈入以推理和应用为驱动的第二阶段 [4] - 与早期一次性、大规模的训练投入不同,推理环节更接近持续调用的模式,无论是企业部署大模型,还是各类AI Agent的落地,都会带来稳定且长期的算力消耗 [4] - 这一转变使算力需求转向"类基础设施消耗",算力逐渐演变为类似电力、带宽一样的长期生产要素,这也是市场愿意给予算力芯片更高估值的重要原因之一 [5] 服务器与算力需求数据 - IDC中国研究经理指出,2025年全球服务器出货量同比增长15%,其中加速服务器同比增长29%,通用服务器同比增长13%,表明二者的需求都处在增长周期中 [3] - AI训练工作负载带来的需求造成DRAM短缺,推理工作负载则一定程度推动了CPU的需求 [3] - 未来,随着AI Agent等场景快速增长,CPU在AI应用中也将扮演愈加重要的角色 [3] 科技巨头资本开支与行业影响 - 全球科技巨头的资本开支成为重要风向标,亚马逊、微软、谷歌、Meta等公司在AI相关领域的投入仍在持续扩大,整体规模已达数千亿美元级别 [5] - 市场的核心分歧正在从"AI是否增长",转向"增长的质量与持续性",部分分析认为,尽管需求强劲,但如此高强度的投入能否持续转化为商业回报,仍存在不确定性 [5] 产业链红利扩散 - 算力红利正在从单一芯片厂商向更广泛环节扩散,例如,高带宽内存(HBM)、先进封装以及上游设备材料厂商,均在本轮周期中获得更高关注度 [6] 行业整体判断 - 本轮算力芯片上涨并非简单的市场反弹,而是对AI资本开支周期与需求结构变化的再确认 [6] - 围绕资本开支可持续性、估值水平以及产业链利润分配的分歧,仍将决定这一行情的持续时间与演绎路径 [6]
英伟达的推理芯片局
半导体行业观察· 2026-03-25 08:40
文章核心观点 文章详细解读了英伟达在2026年GTC大会上发布的一系列新产品、技术路线图及系统架构,核心观点在于英伟达正通过硬件创新、架构整合及生态扩展,巩固并扩大其在人工智能推理基础设施领域的领导地位[3]。公司通过收购Groq整合LPU技术、推出多代GPU与系统、以及布局CPO(共封装光学)等先进互连技术,旨在构建一个覆盖计算、网络、存储的完整且高性能的AI推理解决方案王国[3][93]。 产品与技术发布 - 英伟达在GTC 2026上发布了三款新系统:Groq LPX、Vera ETL256和STX,并更新了Kyber机架架构[3] - 发布了Rubin Ultra NVL576和Feynman NVL1152等多机架系统,并透露了Feynman架构的早期信息[3] - 公司CEO黄仁勋在主题演讲中特别提及了InferenceX,凸显了其对推理市场的重视[3] Groq收购与LPU技术整合 - 英伟达以支付200亿美元获得知识产权许可和团队的形式“收购”了Groq,此举规避了严格的反垄断审查并加速了技术整合[4] - 交易宣布不到四个月,Groq的LPU(语言处理单元)系统概念已被集成到Vera Rubin推理堆栈中[4] - Groq LPU采用独特的“切片”架构,通过高带宽SRAM和确定性执行实现极低的延迟,擅长快速处理token,但与GPU相比在总吞吐量上存在权衡[5][6][8] - 第一代LPU采用GlobalFoundries 14nm工艺,而计划中的第二代LPU因设计问题(SerDes速度未达标)从未量产[6][7] - 英伟达将直接推出第三代LPU(LP30/LP35),跳过有缺陷的第二代,采用三星SF4X工艺,拥有500MB片上SRAM和1.2 PFLOPS的FP8算力[9][14] - 下一代LP40将采用台积电N3P工艺和CoWoS-R封装,集成英伟达自有IP(如NVLink),并与Feynman平台协同设计[15] GPU与LPU协同推理架构(AFD) - 英伟达引入LPU旨在提升高交互场景下的推理性能,利用其低延迟特性加速解码阶段[19] - 提出了注意力前馈神经网络解耦(AFD)技术,将Transformer模型中的注意力机制(有状态、动态)映射到GPU执行,而将前馈网络(FFN,无状态、静态)映射到LPU执行[21][25] - 这种解耦允许GPU的HBM容量更专注于键值缓存(KV Cache),从而支持更多的并发用户[23] - 采用乒乓流水线并行机制来隐藏GPU与LPU之间token路由(分发与合并)产生的通信延迟[27][29] - LPU还可用于部署推测性解码中的草稿模型或多token预测层,以进一步提升解码效率[32] LPX机架系统 - LPX机架系统包含32个1U计算托架,每个托架(节点)包含16个LPU、2个Altera FPGA、1个Intel Granite Rapids CPU和1个BlueField-4前端模块[35][38] - LPU模块采用背靠背方式安装在PCB上,以优化布线[41] - FPGA作为“架构扩展逻辑”,承担协议转换(C2C转以太网/PCIe)、控制流管理以及提供额外DDR5内存(每个FPGA高达256GB)供KV Cache使用的角色[43] - LPU网络分为节点内全网状连接、通过铜背板的节点间/机架内连接,以及通过OSFP笼(可能使用AEC或光模块)的机架间连接,机架内纵向扩展总带宽达640TB/s[44][46][48][52] 英伟达CPO路线图与互连技术 - 英伟达公布了其CPO路线图,重点用于构建超大规模计算系统的机架间互连,而非机架内部[54] - 在Rubin时代,NVL72(Oberon机架)和NVL144(Kyber机架)采用全铜缆纵向扩展;NVL576系统(8个Oberon机架)将在机架间采用CPO互连[55][60] - 在Feynman时代,NVL1152系统(8个Kyber机架)将“完全采用CPO”,但机架内部GPU到交换机的连接预计仍使用铜缆[56][60] - 公司的策略是尽可能使用铜缆,仅在必要时(如长距离、高密度机架间连接)采用光纤/CPO[56] Kyber机架与Rubin Ultra系统更新 - Kyber机架是Oberon之后的新产品,每个机架可容纳144个Rubin Ultra GPU(原设计为72个),计算刀片密度提升[61] - 每个Kyber机架包含72个NVLink 7交换芯片,GPU通过飞线(flyover cables)连接到中板上的交换芯片[63][70] - Rubin Ultra NVL144 Kyber机架将使用全铜缆扩展,而非CPO[65] - 供应链中讨论了NVL288(两个Kyber机架通过铜背板互连)和NVL576(八个Oberon机架通过CPO互连)等更大规模系统[73][76][78] Vera ETL256高密度CPU系统 - Vera ETL256是一个独立的液冷机架,集成了256个Vera CPU,旨在解决AI工作负载中日益增长的CPU需求瓶颈[79] - 机架内部采用Spectrum-X多平面拓扑,通过铜缆实现所有CPU的完全全连接,无需光模块[80][81] - 该设计将计算资源紧密排列,用铜缆的成本节约来抵消液冷的额外开销[79] CMX与STX存储解决方案 - CMX(原称ICMS)是英伟达的上下文内存存储平台,旨在通过NVMe存储扩展键值缓存(KV Cache)容量,解决长上下文推理的瓶颈[84][85] - STX是一个参考存储机架架构,采用基于BlueField-4的存储解决方案,规定了与Vera Rubin计算集群配套所需的硬盘、CPU、DPU、网卡和交换机的数量[87][90] - 这些举措代表了英伟达将其影响力从计算和网络层向存储及基础设施标准化层拓展的努力[92]
盛会直击:英伟达GTC大会四大核心重磅发布
每日经济新闻· 2026-03-23 10:47AI 处理中...
英伟达GPU技术演进与产品优势 - 公司在GPU领域深耕约27年,芯片制程从220纳米迭代至4纳米,未来将向1.6纳米推进 [2] - 2023年AI浪潮爆发时市场主流GPU为A100与H100,目前主流已更新为Blackwell架构芯片 [2] - H100芯片由台积电采用4纳米工艺代工,单芯片集成800亿个晶体管,并内置Transformer模型引擎,硬件层面对Transformer做了专项优化 [2] - H100相比上一代A100芯片,在大模型训练中的能效比与运算速度均有大幅提升,核心优势是极致适配大模型训练场景 [3] - Blackwell芯片则重点针对AI推理场景做了优化,引入了低精度训练等技术,在保留极强训练性能的同时更侧重推理场景 [3] GTC大会核心产品与技术发布 - 公司披露了从Blackwell到Rubin再到Feynman的技术演进路线图,2027年将推出Rubin Ultra架构、CPX芯片与CPU交换机,2028年实现Feynman架构芯片量产 [3] - Feynman架构芯片将采用台积电A16制程(1.6纳米)生产,是全球首款1.6纳米AI芯片,相较上一代N2P工艺,在同等电压下速度提升约10%,晶体管密度提高1.1倍 [4] - Feynman架构芯片单GPU算力达50 PFLOPS,推理性能是Blackwell的5倍,采用背部供电技术,面向机器人、世界模型场景打造,初期公司将独享A16产能 [5] - 公司推出了单机柜576张GPU卡的Rubin Ultra NVL576卡机柜,采用正交背板连接方案,有效提升单机柜算力集成度 [5] - 公司展示了SN6800、SN6810、Q3450三款量产落地的CPO(共封装光学)交换机,这是全球首款量产的CPO交换机,标志着该技术从实验室走向规模化商用 [6] - 公司确立了铜缆、光学、CPO三条技术路线并行推进的发展路径 [6] - 公司正式发布了整合Groq技术的LPU芯片与配套机架,该芯片采用三星4纳米制程,单芯片带宽达150TB/S,专为AI推理场景设计 [6] - LPU芯片相较于Blackwell NVL72,吞吐效率提升35倍,预期2026年下半年出货,核心目标是实现极致的低延迟与高吞吐量,由其负责推理的Decode环节 [7] AI行业发展趋势与算力需求 - AI产业发展的后半程,推理场景的重要性愈发凸显 [3] - AI推理有明确的技术特征,分为Prefill(预填充)与Decode(解码)两个阶段,提升效率的最优方案是将两个阶段拆分运行 [7] - 长期来看,AI行业发展远未触顶,2026年全球AI资本开支预计超7000亿美元 [8] - Agent技术进入规模化商用元年,产业成长空间全面打开 [8]
解析AI云IAAS涨价投资机遇
2026-03-20 10:27
纪要涉及的行业或公司 * **行业**:AI云基础设施即服务(AI Cloud IaaS)、人工智能数据中心(AIDC)、算力租赁、内容分发网络(CDN)、液冷技术、AI计算与网络(包括芯片、服务器、交换机、光模块、电源、光纤光缆)[1][2][9] * **公司**: * **科技巨头**:英伟达、阿里巴巴、腾讯、字节跳动、百度、智谱[1][2][3][4] * **AIDC与算力租赁**:光环新网、润泽科技、奥飞数据、数据港、优刻得[8][9] * **液冷技术**:英维克、申菱环境、高澜股份[9] * **AIDC供电**:中恒电气、科泰电源[9] * **CDN**:网宿科技[9] * **AI芯片**:寒武纪、海光信息[9] * **服务器**:浪潮信息、中科曙光[9] * **交换机**:盛科通信、锐捷网络、中兴通讯、紫光股份[9][10] * **光模块**:中际旭创、新易盛、天孚通信、华工科技[9][10] * **服务器电源**:欧陆通[9][10] * **光纤光缆**:长飞光纤、亨通光电、中天科技[9][10] 核心观点和论据 * **AI云IaaS进入涨价周期**:近期腾讯云、智谱、阿里云、百度云等厂商接连宣布涨价,核心驱动因素是Tokens使用量的暴涨,AIGC需求在2025年底出现显著拐点以及“小龙虾”等应用的出现进一步确认了算力需求爆发,预计后续涨价态势将持续[1][2] * **“Token经济学”成为产业核心**:英伟达在GTC大会上提出“Token算力工厂”概念,将Token定义为新的大宗商品,认为未来数据中心的核心竞争力是每瓦性能,算力即营收[1][3] 阿里巴巴成立ATH事业部整合AI资源,CEO吴永明指出Token将成为人类与数字世界交互的主要载体[4] 这些动向表明AI产业商业模式进入以Token为核心的变现周期,驱动投资形成“为产出更多Token投入算力 -> Token营收支撑算力投入”的良性循环[3][4] * **巨头战略转向,加大AI投资**:腾讯最新财报显示其云业务收入加速增长并已实现规模化盈利,公司计划减少股票回购以将资金用于人工智能领域投资,显示出对AI发展潜力的坚定信心和加大投入的决心[1][4] * **Token增长直接利好AI云IaaS核心板块**:Token的生成与应用等同于对AI芯片的需求,进而传导至AIDC和算力租赁,逻辑链条为:Tokens -> 国产算力 -> 算力租赁 -> AIDC[5][6] 高质量Tokens的产出离不开强大的AI云IaaS支撑,其轮番涨价为AIDC、算力租赁等细分板块打开了价格上行空间[6] * **AIDC与算力租赁市场供需极度失衡**:自2025年底以来国内AIDC需求呈爆炸式增长,阿里、腾讯、字节等巨头因能耗管控严格,正在激烈争抢AIDC资源[7] 算力租赁市场同样火爆,例如H100及5,090服务器需求旺盛,过去一个月价格翻倍,部分企业2026年的B卡订单预计可能增长6倍[1][7] 市场正由买方市场向卖方市场转变[7] * **AIDC估值模型重塑**:市场存在一种说法,即1GW的AIDC资源约对应500亿市值,该模型基于1GW资源约需200亿投资,可产生约35亿EBITDA,给予20倍估值后得到700亿EV,扣除投资后为500亿市值[9] 目前AIDC价格处于底部,若未来形成普遍涨价趋势,1GW资源对应的市值弹性将更大[9] * **液冷技术渗透率将达100%**:英伟达GTC大会确认了后续芯片将100%采用液冷,且LPO也需要液冷,需求旺盛[9] * **CDN及光纤光缆已开启涨价**:随着AI应用发展和边缘计算的崛起,对CDN的拉动作用显现,网宿科技等已宣布涨价[9] 光纤光缆作为网络核心资源,近期也持续涨价[9][10] * **2026年超级节点将带动网络基础设施全面升级**:2026年超级节点是重要技术方向,将带动服务器、液冷、交换机、光模块和服务器电源的全面升级[1][9] 其他重要内容 * **市场存在预期差**:部分观点担忧国内AI应用(如OpenCL)可能只是一时热潮,但即便没有特定爆款应用,以“豆包”为例的AI产品渗透率已显著提升,持续拉动算力需求[7] 光环新网存在较大预期差,市场可能低估了其作为字节跳动AIDC核心供应商和Tokens工厂的地位[9] * **光环新网的核心优势**:公司规划储备1GW资源,均位于“东数西算”核心节点,且其子公司光环云是火山引擎的核心Tokens合作伙伴[9] * **AI应用渗透率提升持续拉动需求**:即便没有特定爆款应用,以“豆包”为例的AI产品渗透率已显著提升,持续拉动算力需求[7]
广发证券:英伟达(NVDA.US)上调收入指引+强调LPU架构 上游原材料有望受益
智通财经网· 2026-03-19 16:05
英伟达上调AI芯片收入指引与产业链影响 - 英伟达在GTC大会上将Blackwell和Rubin系列芯片的收入指引延伸至2027年,预计将帮助公司创造1万亿美元的营收,而去年大会对2026年底的指引为5000亿美元,反映AI需求可见度明显提升 [1] - 英伟达LPX架构预计于2026年下半年开始出货,Groq 3 LPX机架搭载256个LPU处理器,提供128GB片上SRAM和640TB/s扩展带宽,与VeraRubin平台结合后,推理吞吐量/功耗比将提升35倍 [2] - LPU芯片将由三星代工,LPX架构有望进一步打开AI PCB市场空间,从而利好CCL(覆铜板)上游原材料 [1][2] 电子电路铜箔行业趋势与国产化机遇 - 高频高速环境下信号衰减严重,对覆铜板材料电性能要求提升,电子电路铜箔向HVLP(低轮廓铜箔)产品升级,RTF(反转铜箔)与HVLP是主流产品 [3] - 日本三井金属已就用于AI服务器等的半导体极薄铜箔MicroThin与客户展开价格谈判,考虑当前高端电子电路铜箔供需紧缺,国产铜箔供应商有望加速导入供应链 [3] - 2025年日本三井金属高阶铜箔向客户平均涨价约15%,考虑供需紧张,国产厂商亦有望跟随提价,预计HVLP、RTF和HTE(标准铜箔)全系列产品均有提价可能,但RTF和HTE涨价幅度可能略低于HVLP [3] 相关产业链公司 - 推荐德福科技(301511.SZ),因其铜箔产能位于内资铜箔企业第一梯队,可充分受益于铜箔涨价,且其载体铜箔已通过存储龙头验证 [4] - 建议关注铜冠铜箔(301217.SZ),在电子电路铜箔领域积累丰富;嘉元科技(688388.SH),锂电铜箔与宁德时代深度合作并收购恩达通布局光模块;诺德股份(600110.SH),锂电4.5微米产品领先并布局RTF和HVLP产品;中一科技(301150.SZ)等 [4]