英伟达GB300
搜索文档
如何看待算力增长撬动液冷需求跃升
2026-03-24 09:27
电话会议纪要关键要点总结 一、 涉及的行业与公司 * **行业**:数据中心液冷散热行业、半导体存储行业[1] * **公司**:英伟达(NVIDIA)、美光(Micron)、瑞声科技[1][8] 二、 液冷行业核心驱动力 * **算力需求爆发**:AIGC等应用带动算力大规模增长,成为核心驱动力[2] * **芯片功耗剧增**:英伟达芯片功耗从B200的700瓦跃升至GB300的1,400瓦,使液冷从可选项变为必选项[1][2] * **机柜功率密度提升**:机柜功率密度从10千瓦跃升至50-100千瓦以上,传统风冷成本陡增且难以满足需求[1][2] * **政策能效要求**:政策要求2025年底全国数据中心平均PUE降至1.5以下,“东数西算”工程中新建数据中心PUE要求低至1.1,液冷是满足合规的关键手段[5] 三、 液冷技术路线与市场 * **技术分类**:主要分为接触式(浸没式、喷淋式)和非接触式(冷板式)[3] * **冷板式液冷(当前主流)**: * 单相冷板在数据中心应用比例超90%[3] * 市场规模预计从2025年的38亿美元增长至2033年的160亿美元[1][3] * **浸没式液冷(未来趋势)**: * 散热效果更优,可将数据中心PUE降至1.05以下[1][4] * 市场规模预计从2025年的22亿美元增长至2033年的113亿美元,成长潜力最大[1][4] * **喷淋式液冷**:受硬件限制应用较少,市场规模预计从2025年的5亿美元增长至2033年的20亿美元[4] 四、 液冷系统价值链 * **液冷板**:技术壁垒最高,价值量占比约40%[1][6] * **CDU(冷却液分配单元)**:承担热交换与循环分配关键功能,价值量占比约30%[1][6] * **接头及管路等**:合计价值量占比约15%[1][7] 五、 液冷行业格局与供应链变化 * **供应链开放**:从英伟达等头部企业的台系独供转向开放,为大陆厂商提供机遇[1][8] * **大陆厂商切入**:许多大陆厂商已进入供应链第二、三级配套环节[1][8] * **新需求涌现**:谷歌等云服务商进行芯片高度定制化,带来新的散热增量市场[8] * **行业整合加速**:出现通过收购并购进行整合的趋势,例如瑞声科技收购远地数字科技,推进国产替代与国际化[8] 六、 存储行业动态(以美光为例) * **美光业绩超预期**:2026年第二季度营收环比增长75%,同比增长196%,毛利率亦超预期[8] * **业绩核心驱动力**:业绩超预期主因是产品价格大幅上涨,而非出货量增长[1][8] * DRAM价格环比上涨65%[1][8] * NAND价格环比上涨75%至80%[1][8] * 两者出货量仅为个位数增长[8] * **行业需求展望**: * 预计到2026年底,数据中心在DRAM和NAND市场的位元需求占比将超过50%[1][9] * AI服务器需求将驱动公司整体出货量维持10%至15%的同比增长[1][9]
GTC前瞻-液冷环节有哪些值得期待
2026-03-12 17:08
涉及的行业与公司 * **行业**:数据中心液冷散热行业,特别是面向AI服务器(训练与推理)的液冷解决方案[1] * **核心公司**:英伟达(NVIDIA)[1] * **供应链公司**: * **冷板供应商**:英维克、斯全、伟迪[1][11][13] * **快接头供应商**:川环科技[11] * **CDU供应商**:AVC、Cooler Master、双鸿[1][14] * **代工/封装**:工业富联[12] 核心观点与论据 英伟达新产品规划与市场策略 * **LPU (Liquid Processing Unit) 整机柜**: * **定位与架构**:面向推理市场的整机柜解决方案,对标Google TPUv6e,采用ASIC架构和SDRAM(非HBM)以实现高性价比[1][2] * **上市时间**:预计2027年Q1-Q2小批量供应[1],具体可能在2027年3-4月[2] * **互联方式**:可独立使用,或通过NVLink Fusion线缆与单个GPU机柜互联,或通过Patrim 6交换机与多个GPU机柜组成集群[2][4] * **供应链策略**:出于降本考虑,预计将放宽对国产供应商的限制,在冷板、快接头等环节给予更多机会,国产供应商份额可能达20%-30%甚至更高[1][8] * **Rubin 系列**: * **量产节奏**:计划2026年7月投产,持续至12月,2026年下半年预计出货约9,500套整机柜,2027年1月进入正式量产[9] * **2026年出货主力**:GB300系列,预计全年出货约55,000套整机柜[9] * **GB200系列**:预计2026年出货约10,000套,供应集中在Q1-Q2,7月基本停产切换至Rubin[9] * **2027年出货预期**:尚未明确,预计2026年10月后才会明朗[10] 液冷技术升级与价值量变化 * **LPU液冷方案**: * 采用全液冷但结构更简单的“轻液冷”模式,可能使用更低温冷却液或减少循环量[1][2][3] * 冷板与快接头用量显著增加,单计算单元(Computer Code)液冷系统(含冷板、快接头及管路)价值量预计达1,000-1,200美元,高于Rubin和GB300[1][5] * CDU环节预计无显著变化,需求可能因总功耗较低而下降[6],其单瓦价值量尚未确定,预计2026年8-9月明确[7] * **Rubin液冷技术升级**: * 引入大冷板模式与液冷微通道技术,为芯片高效散热[11] * 微通道技术需与GPU芯片焊接,由工业富联在组装Computer Tray前完成,对精密加工要求高[12] * 采用微通道技术后,冷板表面增加防腐蚀层,工艺优于GB200/GB300[11] * 单GPU冷板价值量升至约300美元,一个含4个GPU的Computer Tray冷板价值量达1,100-1,200美元[11] * 芯片功耗提升带动CDU功耗增加,快接头数量也随之增加以提高冷却液流速[11] * **未来新技术**: * **两相冷板**:处于样品研发阶段,预计2026年Q3开始送样,其价值量较单相冷板预计提升50%-60%[16][17] * **金刚石散热**:针对Rubin Ultra的非通用开放技术,处于材料选型和结构设计阶段,仅伟迪、AVC等少数指定供应商拥有设计权限[18][19] 供应链竞争格局 * **高端系列(Rubin/GB)**:冷板、CDU等核心环节仍由台系及欧美供应商主导(如AVC、CoolerMaster)[1][14] * **国产供应商进展**: * **冷板**:在Rubin项目中,英维克和斯全已进入供应链,预计2026年下半年开始供应,目标份额分别约为10%和5%-6%[11][15];在微通道技术方面,英维克和斯全正在送样认证,预计2026年Q2完成,有望在2026年下半年获得份额[13] * **快接头**:川环科技参与Rubin项目,但份额较小[11];Manifold主要由川环科技供应[14] * **CDU**:在Rubin和GB300等高端产品上,尚未有国产供应商实现批量供应[11][15] * **LPU带来的机会**:由于对性能要求相对较低且注重成本,国产供应商在冷板、快接头等环节的份额有望显著高于其在Rubin系列中的占比[1][8] 其他重要信息 * **供应商认证**:对于LPU,英伟达大概率沿用现有供应商体系;新供应商认证周期通常需要2-3个季度,包括审厂、研发评估、样机测试等环节[8] * **GTC大会关注点**: * 关注液冷技术在Rubin和LPU产品上的具体提升[20] * 关注参展商名单,以判断哪些公司已进入英伟达供应链体系[20]
美国拟将AI芯片出口管制扩展至全球,英伟达、AMD出口均需获许可
搜狐财经· 2026-03-06 07:10
美国政府拟议的AI芯片出口管制新规 - 美国政府正酝酿一项针对AI芯片出口的全面管制新规 拟将现行覆盖约40个国家和地区的限制措施扩展至全球范围[1] - 新规草案要求 未来英伟达 AMD等公司的AI加速器出口至全球任何地区 都可能需要事先获得美国政府的批准[1] - 消息传出后 美股芯片股应声下跌 英伟达股价一度跌1.9% AMD跌幅达2.3%[1] 新规核心内容与审批机制 - 新规将从根本上改变美国在AI芯片出口管制领域的角色 从对特定国家实施限制转变为充当全球AI产业的“守门人”[3] - 企业甚至包括其政府 都需获得美国商务部工业与安全局的批准 才能采购用于训练和运行AI模型的关键加速器[3] - 审批流程的严格程度取决于采购规模 分为三级[3][6] - 小型部署(不超过1000颗英伟达最新GB300)接受相对简化的审查 并可能享有部分豁免机会[3] - 中型集群(超过1000颗)企业需在申请出口许可前获得预先批准 并可能面临附加条件 例如披露商业模式或允许美国政府实地检查[6] - 超大规模部署(单一国家 单一企业超过20万颗)需所在政府介入 美国仅会向作出严格安全承诺并在美国AI领域进行“对等投资”的盟友批准此类出口 草案目前未明确投资比例[6] 新规对行业与公司的潜在影响 - 新规为计划建设吉瓦级大型数据中心的国家 如法国 印度 带来了巨大的不确定性[4] - 各国在算力供应方面选择有限 要么从英伟达等美商进口 要么转向产量较少的华为等中国厂商[4] - 20万颗GB300的规模是英国AI芯片租赁公司NScale计划向微软在美欧四地提供的数量 该公司称之为“史上最大规模AI基础设施合约之一”[4] - 若华盛顿能够快速批准芯片销售且附加条件较少 全球AI基础设施建设可能只需应对更多文书工作[4] - 若出现官僚拖延或冗长谈判 则可能打乱项目规划 例如去年美国与阿联酋达成芯片出口协议后 数月后才开始发放许可 条件是海湾国家在美国每投资1美元 对应在国内投资1美元[4] 新规当前状态 - 美国政府的这套框架尚未最终敲定 目前联邦机构官员正在提供意见 草案内容可能大幅调整 也可能因其他优先事项而被搁置[4] - 这是自去年5月废除拜登时期AI扩散规则以来 本届政府在制定全球芯片出口战略方面迈出的最实质性一步[4] - 截至发稿 美国商务部工业与安全局 英伟达和AMD均未置评[5]
电子行业周报:谷歌/亚马逊26年CAPEX指引超预期,AI硬件需求强劲-20260208
国金证券· 2026-02-08 19:11
行业投资评级 - 报告未明确给出统一的行业投资评级,但整体观点积极,持续看好多个细分领域 [1][4][26] 核心观点 - 科技巨头资本开支指引超预期,AI硬件需求强劲,核心算力硬件及产业链将持续受益 [1][4][26] - AI需求正从云端向端侧拓展,带动消费电子、PCB、存储、半导体设备材料等多个细分领域景气上行 [4][5][20][23] 细分行业总结 云计算与AI基础设施 - **资本开支指引强劲**:亚马逊将2026年资本支出预期上调至**2000亿美元**,较2025年的**1310亿美元**增幅超**50%** [1];谷歌母公司Alphabet预计2026年资本支出在**1750至1850亿美元**之间,几乎是2025年**914亿美元**的两倍 [1] - **云业务高速增长**:亚马逊AWS云部门同比增长**24%**,未完成订单达**2440亿美元**,同比增长**40%**,环比增长**22%** [1];谷歌云四季度营收达**177亿美元**,同比增长**48%**,为近四年多来最快增速 [1] - **自研芯片进展显著**:亚马逊自研芯片Trainium性价比相较同类GPU高出**30%至40%**,年化营收运行率达数十亿美元且产能“完全售罄” [1];下一代Trainium3芯片性价比再提升约**40%**,预计年中产能被预订一空 [1] - **算力供给持续紧张**:亚马逊与谷歌均表示当前算力偏紧,需求异常强劲,限制了增长速度 [1] 印刷电路板与覆铜板 - **行业高景气度维持**:产业链保持高景气度,AI开始大批量放量,汽车、工控需求亦受政策补贴加持 [6] - **覆铜板涨价在即**:中低端原材料和覆铜板涨价在即,覆铜板涨价斜率有望变高 [6] - **台系厂商营收增长**:台系覆铜板厂商月度营收同比增速保持高位 [14][15] - **公司订单强劲扩产**:多家AI-PCB公司订单强劲,正在大力扩产,业绩高增长有望持续 [4][26] 消费电子与端侧AI - **AI应用落地加速**:大模型调用量高速增长,AI正迈向大规模生产力赋能阶段 [5] - **看好苹果产业链**:苹果持续打造芯片、系统、硬件创新及端侧AI模型核心竞争力,算力与运行内存提升是主逻辑,带动PCB、散热、电池等组件迭代 [5] - **智能眼镜等新品推进**:多家厂商发布AI智能眼镜,Meta、苹果、微软等大厂均有布局;AI端侧应用产品加速,覆盖AIPin、智能桌面、智能家居等 [5] 半导体存储 - **存储进入上行周期**:供给端减产效应显现,存储大厂开启涨价;需求端云计算大厂Capex启动,企业级存储需求增多,同时消费电子补库需求加强 [20] - **价格涨幅上修**:2025年第四季Server DRAM合约价涨幅从先前预估的**8-13%** 上修至**18-23%**,且可能再度上修 [20] - **看好国产替代**:持续看好企业级存储需求及利基型DRAM国产替代机会 [20][22] 半导体代工、设备、材料与零部件 - **自主可控逻辑加强**:美日荷半导体设备出口管制措施出台,产业链逆全球化,国产化加速 [23] - **设备市场稳健增长**:2025年第二季度全球半导体设备出货金额达**330.7亿美元**,同比增长**24%**,环比增长**3%** [24];中国大陆和中国台湾25Q2设备支出分别为**113.6亿美元**(同比-**7%**)和**87.7亿美元**(同比+**125%**) [24] - **封测需求旺盛**:先进封装需求旺盛,寒武纪、华为昇腾等AI算力芯片需求推动产能紧缺与扩产 [23] - **材料国产化机遇**:美国杜邦在逻辑和存储领域断供,日本加入设备制裁,材料风险增加,看好国产化快速导入 [25] 元件与显示 - **被动元件受益AI升级**:AI手机单机电感用量预计增长,价格提升;MLCC手机用量增加,均价提升 [18];WoA笔电(ARM架构)中MLCC总价大幅提高到**5.5~6.5美金** [18] - **面板价格企稳**:LCD面板价格企稳,控产有效,1月有望报涨 [18] - **OLED国产化机会**:国内OLED产能释放、高世代线规划带动上游设备材料需求增长,国产替代加速 [19] 重点公司观点 - **胜宏科技**:预计2025年净利润为**41.6亿元-45.6亿元**,同比增长**260.35%-295%**,受益于AI算力与数据中心需求 [27] - **北方华创**:半导体装备产品技术领先,平台化布局完善,通过并购进一步丰富产品线 [28] - **中微公司**:高端刻蚀设备新增付运量显著提升,推出多款新产品加速向平台化转型 [28][29] - **兆易创新**:公司步入上行周期,25Q3毛利率环比改善**3.71个百分点**,净利率改善**3.74个百分点**,看好“国产替代+定制化存储”逻辑 [31] - **三环集团**:AI需求带动SOFC业务增长,高容量和小尺寸MLCC研发进展显著 [33] - **江丰电子**:积极布局静电吸盘业务以应对卡脖子风险,计划募资不超过**19.48亿元**用于相关产业化项目 [34] 市场行情回顾 - **行业涨跌幅**:报告期内(2026.02.02-2026.02.06),电子行业涨跌幅为-**5.23%**,在申万一级行业中排名靠后 [35] - **细分板块表现**:电子细分板块中,品牌消费电子、光学元件、面板涨幅居前;模拟芯片设计、集成电路封测、数字芯片设计跌幅靠后 [37] - **个股表现**:欧莱新材、利通电子、科森科技等涨幅居前;华虹公司、深科技、寒武纪-U等跌幅居前 [39]
国盛证券:从预期到兑现 液冷迈向第二发展阶段
智通财经网· 2025-12-22 14:11
液冷产业发展阶段转换 - 液冷产业正从以概念和预期验证为主导的“第一发展阶段”,进入以订单确认、产能落地和业绩兑现为核心的“第二发展阶段” [1] - 市场焦点从液冷概念讨论、技术路线研究及远期市场空间测算,转向业绩兑现 [1] 产业发展的核心驱动力 - AI集群规模化建设推进,100kW+高功率机柜成为新常态,液冷体系开始落地 [2] - 英伟达GB200/GB300 NVL72采用全液冷架构,GB300系列AI服务器机柜自2025年底起量产 [2] - 预计2026年下半年起Vera Rubin平台落地,将进一步推高液冷价值量 [2] - AWS、Meta自研ASIC将自2026年起逐步采取液冷方案,Google、Microsoft的自研ASIC AI服务器亦预计逐步由气冷转为水冷设计 [2] - 液冷应用边界从GPU服务器向交换机、ASIC等设备侧延展,市场空间应被系统性重估 [2] 竞争格局演变 - 竞争焦点从单一零件竞争,拓展为横跨服务器、机柜到机房设备的完整热管理系统 [1][3] - 产业价值不再局限于单一部件,而是冷板、CDU、控制与运维协同的系统能力,客户对方案商依赖度提升 [1][3] - 订单和确定性成为关键,产业格局呈现强者恒强态势 [3] - 行业龙头在全链条布局、系统集成与交付、头部客户认证等领域优势凸显 [3] 龙头企业的核心能力 - 拥有覆盖CDU、冷板、快接头、冷却液等的全链条解决方案能力,实现从部件到整体的完整布局 [3] - 具备全链条自研与系统协同、以及大规模、稳定可靠的生产交付能力 [3] - 在全球交付经验、认证体系、客户协同等方面具备天然优势 [3] - 提前布局,有望切入国内外主流云服务商、服务器厂商或芯片原厂供应链 [3] 投资观点与关注标的 - 具备全栈解决方案能力、已获头部客户认证并拥有大规模交付经验的龙头企业,将成为此轮产业确定性红利的主要受益者 [4] - 看好最具备出海能力的龙头英维克,以及龙头上下游配套产业链,包括泵生产厂商飞龙股份等 [4] - 继续看好算力板块,坚定推荐算力产业链相关企业如光模块行业龙头中际旭创、新易盛等 [4] - 建议关注光器件“一大五小”天孚通信+仕佳光子/太辰光/长芯博创/德科立/东田微 [4] - 建议关注国产算力产业链,如其中的液冷环节如英维克、东阳光等 [4]
20cm速递|关注创业板人工智能ETF国泰(159388)投资机会,通信业增长与AI算力需求引关注
每日经济新闻· 2025-12-10 14:44
行业核心观点 - 2026年通信行业将围绕算力、红利(运营商)、战力(卫星互联网)三大板块展开 [1] 算力板块 - 全球AI保持高景气,应用侧持续发力,投资端有望加大投入 [1] - 硬件端英伟达GB300等超节点方案加速发货,ASIC出货有望放量 [1] - 国内超节点渗透率快速提升 [1] - 方案升级及超节点渗透率提升将带动交换网络、光模块、液冷、电源、铜连接等细分领域需求放量 [1] - 光模块行业迎来800G/1.6T放量、硅光渗透率提升等机遇 [1] - AI算力需求中长期趋势确定,短期采购放缓属阶段性调整,后续随应用端放量逐步修复 [1] 运营商板块 - 电信运营商创新业务增速提升,卫星/算力业务贡献新弹性 [1] - 电信运营商股息率价值凸显 [1] 卫星互联网板块 - 国内商业航天快速发展,低轨卫星组网加速 [1] - 卫星互联网相关公司订单有望增长 [1] - 卫星互联网行业资本开支中长期市场空间和景气度乐观 [1] 相关金融产品 - 创业板人工智能ETF国泰(159388)跟踪的是创业板人工智能指数(970070),单日涨跌幅达20% [1] - 该指数从创业板市场中选取涉及人工智能技术开发与应用的上市公司证券作为指数样本,覆盖软件、硬件及相关服务领域 [1] - 该指数重点配置具有高成长性和创新性的企业,聚焦人工智能领域的前沿发展 [1]
谷歌TPU助力OpenAI砍价三成,英伟达的“王座”要易主了?
36氪· 2025-12-02 16:19
公司战略转变 - 谷歌TPU战略从主要服务内部AI模型转向积极向第三方销售芯片,直接与英伟达竞争 [1] - 公司通过谷歌云平台向外部客户提供TPU,并作为商业供应商销售完整TPU系统,以成为差异化云服务提供商 [2] - 与Anthropic达成的合作是公司外部战略的标志性一步,涉及直接销售硬件和通过云平台租赁两种方式 [2][3] 重要客户与合作 - Anthropic成为谷歌TPU首批重要客户,交易涉及约100万颗TPUv7芯片 [1][3] - 交易分配为:博通直接向Anthropic出售内含40万颗TPUv7芯片的成品机架,价值约100亿美元 [3] - Anthropic还将通过谷歌云平台租用另外60万颗TPUv7芯片,预计产生约420亿美元履约价值,占GCP第三季度新增订单积压490亿美元的大部分 [3] - 谷歌在早期对Anthropic进行了积极投资,并设定了15%的股权上限以扩大TPU外部应用 [2] 技术规格与成本优势 - TPUv7 "Ironwood"在理论算力(FP8 TFLOPs达4,614)和内存带宽(7,380 GB/s)上已接近英伟达Blackwell架构产品 [5][6] - 对谷歌而言,每颗TPU的总拥有成本比英伟达GB200低约44% [6] - 即使对外部客户,每个有效计算单元的成本仍可能比英伟达系统低30%-50% [6] - 谷歌系统支持将9,216颗芯片互联为统一计算域,而英伟达系统通常只能连接64到72颗芯片,在分布式AI训练中更具扩展性 [8] 市场影响与竞争格局 - OpenAI凭借转向TPU或其他替代方案,在与英伟达的谈判中获得了约30%的价格折扣 [1] - TPU已成为顶级AI模型的首选,谷歌Gemini 3 Pro和Anthropic Claude 4.5 Opus主要依托TPU和亚马逊Trainium芯片训练 [4] - 分析预测谷歌云未来几个季度有望与Meta、OpenAI等更多AI巨头达成类似交易 [3] 软件生态与部署模式 - 谷歌正加大投入消除软件兼容性制约,开发对PyTorch框架的原生支持并集成vLLM等推理库,目标是不要求开发者重构整个工具链 [10][12] - 公司采用创新融资模式,与Fluidstack等云服务商及TeraWulf等加密矿企合作,谷歌常担任财务保障角色以快速转型现有设施为AI算力设施 [12] 未来竞争与风险 - 英伟达正筹备在2026到2027年推出"Vera Rubin"芯片,采用HBM4内存等激进设计 [13] - 谷歌的应对策略是TPUv8双线开发,但项目已有延迟,且未积极采用台积电2nm工艺或HBM4内存等前沿技术 [13] - 若英伟达成功实现Rubin芯片性能提升,TPU现有的价格优势可能不复存在,其系统甚至在谷歌内部工作负载中可能比TPUv8更具经济效益 [13]
工业富联发布澄清公告:并未下调第四季度利润目标
证券日报· 2025-11-25 00:43
市场传闻与公司回应 - 市场传闻称工业富联AI服务器机柜出货量和单柜利润面临下修,且公司已下调第四季度业绩目标,导致11月24日股价下跌7.8% [2] - 公司发布澄清公告,明确否认相关不实言论,称第四季度整体经营及英伟达GB200、GB300等核心产品出货均按计划推进,客户需求畅旺,生产及出货一切正常 [2] - 公司强调未下调第四季度利润目标,不存在应披露未披露信息,与客户合作的下一代产品按计划推进 [2] 公司经营业绩表现 - 2025年第三季度公司营收达2431.72亿元,同比增长42.81%,归属于上市公司股东的净利润为103.73亿元,同比增长62.04%,均创单季度历史新高 [3] - 前三季度营收6039.31亿元、归属于上市公司股东的净利润224.87亿元,已接近去年全年水平 [3] - 增长动力主要来自AI服务器市场扩张、超大规模数据中心AI机柜产品规模化交付以及云服务商业务爆发式增长,其中云服务商GPU AI服务器前三季度营收同比增长超300% [3] 产品布局与生产状况 - 公司GB200出货顺利,GB300在第三季度实现量产,良率与测试效率持续上行 [3] - 单位成本下降及良率提升预计对第四季度毛利率形成正面支撑,公司对交付效率的持续性保持信心 [3]
工业富联紧急回应“业绩下调”传闻,不到一个月股价跌三成
第一财经· 2025-11-24 18:58
工业富联股价表现与市场传闻 - 工业富联股价自10月30日至11月24日累计下跌30.77%,市值蒸发超4000亿元,11月24日单日下跌7.8% [1] - 市场传闻工业富联下调第四季度业绩目标及机柜出货预期,公司紧急澄清称第四季度经营及英伟达GB200、GB300等产品出货均按计划推进,客户需求畅旺,生产出货正常 [3] - 公司明确表示未向市场下调第四季度利润目标,并称下一代产品合作开发按前期计划顺利推进 [3] 公司与英伟达最新季度业绩 - 英伟达2026财年第三财季营收达570亿美元,同比增长62%,净利润319亿美元,同比增长65% [4] - 工业富联第三季度营收2431.72亿元,创单季度历史新高,同比增长42.81%,净利润103.73亿元,同比增长62.04% [4] - 英伟达CEO黄仁勋强调Blackwell芯片销量远超预期,云端GPU已售罄 [4] 机构动向与行业竞争格局 - 对冲基金桥水在第三季度大幅减持英伟达,减持比例近三分之二 [4] - 彼得·蒂尔旗下的Thiel Macro Fund第三季度出售约53.7万股英伟达股票,占其投资组合近40% [4] - 谷歌Gemini 3模型在主流基准测试中实现领先,可能改变AI竞争格局,谷歌对英伟达GPU的依赖相对较低 [5] 供应链关系与市场预期 - 工业富联作为英伟达核心供应商,其服务器出货情况与英伟达AI芯片需求相关 [1][5] - 摩根士丹利预估2024年英伟达HGX/DGX服务器中28%来自鸿海及工业富联 [5] - 英伟达计划助力OpenAI构建至少10吉瓦的AI数据中心,内含数百万块英伟达GPU [5]
英伟达最强对手,来了
半导体行业观察· 2025-11-07 09:00
TPU v7 (Ironwood)性能突破 - 谷歌最新一代Ironwood TPU加速器性能实现重大飞跃,性能是TPU v5p的10倍,是TPU v6e"Trillium"的4倍 [4] - 单个Ironwood TPU提供4.6 petaFLOPS的密集FP8性能,略高于英伟达B200的4.5 petaFLOPS,略低于GB200/GB300的5 petaFLOPS [3] - 计算平台配备192GB HBM3e内存,提供7.4 TB/s带宽,与英伟达B200(192GB HBM,8TB/s内存带宽)处于同一水平 [3] - 每个TPU具有四个ICI链路,提供9.6 Tbps总双向带宽,而英伟达B200/B300为14.4 Tbps (1.8 TB/s) [3] 大规模扩展架构优势 - 谷歌TPU以Pod形式提供,单个Ironwood模块可通过专有互连网络连接多达9216个独立芯片 [7] - 9216颗芯片共享1.77PB高带宽内存,互连带宽高达9.6 Tbps,相当于在不到两秒内下载整个美国国会图书馆 [7] - 采用光路交换技术构成动态可重构架构,组件故障时可在几毫秒内自动绕过中断点,保持工作负载运行 [7] - 液冷系统整体正常运行时间保持约99.999%可用性水平,相当于每年停机时间不到6分钟 [8] - 采用3D环面拓扑结构,每个芯片以三维网格形式连接其他芯片,无需使用高性能数据包交换机 [8] Axion CPU战略布局 - 谷歌部署首款基于Armv9架构的通用处理器Axion,基于Arm Neoverse v2平台构建 [11] - Axion旨在比现代x86 CPU提升高达50%性能、高达60%能效,比云端最快通用Arm实例性能高30% [11] - 该CPU每个核心配备2MB私有L2缓存,80MB L3缓存,支持DDR5-5600 MT/s内存和统一内存访问 [11] - 早期客户Vimeo报告核心转码工作负载性能提升30%,ZoomInfo在Java服务上性价比提升60% [12] 软件生态系统与生产力 - AI超级计算机客户平均实现353%三年投资回报率,降低28% IT成本,提高55% IT团队效率 [14] - 谷歌Kubernetes Engine为TPU集群提供高级维护和拓扑感知功能,实现智能调度和高弹性部署 [14] - 开源MaxText框架支持监督式微调和生成式强化策略优化等高级训练技术 [14] - 推理网关通过前缀缓存感知路由等技术,将首次令牌延迟降低96%,服务成本降低高达30% [14] - 推理网关监控关键指标并智能路由请求,对共享上下文的请求路由到同一服务器以减少冗余计算 [15] 行业竞争格局与客户采用 - Ironwood Pods的FP8 ExaFLOPS性能被谷歌称为是其最接近竞争对手的118倍 [7] - 谷歌TPU v4支持最大4096芯片POD,TPU v5p提升至8960芯片,Ironwood进一步达到9216芯片 [16] - Anthropic计划利用多达一百万个TPU来训练和运行其下一代Claude模型 [16] - 亚马逊Trainium 2加速器在其计算结构中也采用2D和3D环面网格拓扑结构 [16]