Workflow
英伟达B200
icon
搜索文档
股价大涨近10%!美光公开辟谣HBM4没拿到单!大摩“暴力”上调目标价至450美元!(美光小会全文)
美股IPO· 2026-02-12 07:46
公司核心动态与业绩 - 美光科技首席财务官Mark Murphy在Wolfe Research大会上表示,公司已开始大规模生产并向客户交付HBM4芯片,且第一季度出货量正在顺利提升,这比2024年12月财报电话会议中提及的时间提前了一个季度 [1][4][18][32] - 公司重申其2026年全年的HBM产能已被客户订单全部锁定,处于供不应求状态,且这一格局预计至少延续至2028年 [1][6][18] - HBM4的研发进度符合预期,已与英伟达等头部AI客户开展联合验证,量产节点仍维持在2026年第二季度,与此前指引一致 [1][15] - 公司当前主力产品HBM3E在性能、功耗上仍具领先优势,完全支撑英伟达H200、B200等主力GPU的需求 [1] - 公司预计2026财年第二季度营收将环比增长37%,毛利率指引为68%,且自财报发布以来财务展望因价格因素得到进一步改善 [8][19][33] - 摩根士丹利将美光目标价从350美元大幅上调至450美元,较当前股价隐含约28.6%的上涨空间,并预测公司2026日历年每股收益将飙升至52.53美元 [2][7][10][12] 市场供需与行业格局 - HBM总体可触达市场预计在2028年达到1000亿美元,较2025年的350亿美元实现三年翻三倍 [2] - 存储芯片供应短缺已蔓延至每一个终端市场,定价权完全掌握在卖方手中,DRAM和NAND在2026年第一、第二季度的定价持续走高 [2][7][8] - 美光官方指引隐含第二财季平均销售价格环比增长约30%,而竞争对手如闪迪指引其NAND ASP环比暴涨60%,三星和海力士的模型预测Q1常规DRAM价格将上涨48%和55% [8] - AI驱动的结构性供需失衡是核心,需求端增长爆炸性:英伟达预计从现在到2026年底将增加300亿美元的季度收入,AMD数据中心部门季度收入预计翻倍至100亿美元,博通半导体业务将翻倍至约250亿美元,整个存储行业未来12个月内需应对接近2000亿美元的年化新增收入需求 [14] - 供应端增长缓慢,预计到2026年底,包括合肥长鑫、海力士M15和三星P4L在内的晶圆投片量同比增速仅为7% [14] - HBM生产更“吃硅”,其换算比(如HBM3约为3:1)会随着技术迭代进一步扩大,从而挤压面向其他市场的DRAM供给 [21][22][67] - 瑞银、野村等机构判断,存储芯片出现“有意义的供给缓解”最早也要到2028年前后 [48][56][68] 技术与产品进展 - 美光HBM4产品可提供超过11 Gbps的速度,公司对其性能、质量与可靠性非常有信心 [18] - 公司在HBM3E产品上比竞争对手功耗低30%,从HBM3E到HBM4,带宽实现了超过翻倍 [25] - 公司通过将LPDRAM引入服务器配置,其功耗比传统DDR低60%,今年推出的系统其LPDDR容量将是去年的三倍,可把首token时间缩短98% [26][38] - 在NAND侧,以“每瓦读取性能”衡量,公司产品性能是HDD的15倍,公司在数据中心SSD市场拥有完整的产品组合,业务运行速率已达10亿美元级别 [26][35][36] - 公司正在推进1γ制程节点的爬坡,这将在2026自然年提供增量供给,此外还有爱达荷1号、台湾铜锣(收购金额18亿美元)等绿地产能计划在2027年及之后上线 [21][41] 客户关系与商业模式 - 客户主动寻求与公司签订多年期供应协议,时间视野延长,以确保未来3到5年甚至更长期的供货保障,这反映了内存与存储在AI系统中的重要性提升 [25][26][28] - 公司认为其技术领先、产品领先以及与客户的深度工程协作关系,是获得客户长期承诺的基础 [26] - 公司即将拥有的美国本土供给能力也增加了对客户的吸引力 [27] 财务与估值展望 - 摩根士丹利预测美光2026日历年调整后每股收益为52.53美元,较其旧预测40.86美元上调29%,调整后毛利率预测为76.3%,较旧预测71.8%上调6个百分点 [12] - 市场共识预期认为美光盈利将在2027年晚些时候见顶于12美元左右,但摩根士丹利认为这一预测极其保守,公司盈利可能会在未来一年半持续超出共识 [10] - 摩根士丹利认为传统周期性估值框架已不适用,基于AI溢价,给予公司25倍市盈率,乘以18美元的“跨周期每股收益”,得出450美元目标价 [11][13] - 公司每季度约能产生100亿美元的现金,相当于当前企业价值的10%,将极大改善资产负债表 [13] - 当前股价对应48美元盈利预测的市盈率仅为8倍,而公司当前毛利率已比上一个周期峰值高出10到15个百分点 [11] 市场传闻与机构观点 - 此前市场担忧源于SemiAnalysis报告,该报告推测美光HBM4可能无法用于英伟达新一代Vera Rubin产品线,但报告本身限定于“今年”和“Rubin平台”的HBM4,而非全系列平台和产品 [5][45][47] - 公司CFO明确回应旨在澄清关于HBM4情况的不准确报道,强调技术执行出色且良率符合预期 [6][18] - 摩根士丹利认为,市场担忧的HBM4量产问题、中国存储芯片产能冲击以及资本开支过热等风险,在强劲的AI需求面前都是无关紧要的噪音 [7][15] - 高盛大幅上调2026年一季度DRAM价格涨幅预测,预计DDR4和DDR5整体价格环比涨幅将高达90-95% [52] - 花旗集团激进看涨,将2026年DRAM的平均售价涨幅预期从53%上调至88%,NAND涨幅预期从44%上调至74%,并预测服务器DRAM的ASP将同比暴涨144% [69][70] - 摩根大通预计2026年NAND行业混合平均销售价格将同比大幅上涨40%,且2027年将长期维系在高位,并强调在AI推理时代,企业级SSD的重要性不亚于HBM [68][69] - 华尔街机构普遍认为,AI驱动的“存储芯片超级周期”已全面到来,其强度与持续时间可能远超以往 [66][68]
下周(1月26日-2月1日)市场大事预告
搜狐财经· 2026-01-25 20:41
中国宏观经济数据与政策发布 - 下周将公布中国2025年12月及全年规模以上工业企业利润同比数据 [3] - 1月31日将公布中国1月官方制造业PMI数据 去年12月PMI为50.1% 比上月上升0.9个百分点 [6][8] - 中国央行印发《人民币跨境支付系统业务规则》 该规则自2026年2月1日起施行 [9] 中国金融市场动态 - 下周逆回购到期规模为11810亿元 另有2000亿元MLF于周一到期 本周央行已开展11810亿元逆回购操作 净投放2295亿元 [1] - 下周有30家公司限售股解禁 总市值逾400亿元 1月27日是解禁高峰期 解禁市值居前三位的是海博思创(231.54亿元)、福斯达(53.67亿元)、益方生物-U(42.51亿元) [6] - 下周将有3只新股发行 1月26日发行北芯生命 1月30日发行林平发展、电科蓝天 [6] - 万科57亿中票持有人会议议案出炉 含四套兑付方案 最高拟兑付40%本金 1月28日兑付 [9] 中国公司及行业动态 - 国产GPU公司天数智芯将于1月26日发布未来三代产品路线图 内容涵盖创新GPGPU架构设计等核心方向 业界预测2026至2028年该路线图所涉产品将与英伟达H200、B200展开正面角逐 [9] - 国新办将就2025年商务工作及运行情况、2025年国资央企高质量发展情况举行新闻发布会 [2][4] - 将公布中国香港四季度GDP同比初值等数据 [5] 全球宏观经济与央行政策 - 美联储将于北京时间1月30日凌晨3点公布1月利率决议 随后主席鲍威尔将召开新闻发布会 市场普遍预计美联储将按兵不动 且一季度降息可能性极低 宽松窗口或推迟至5月鲍威尔任期结束后 [8] - 下周将公布多项美国经济数据 包括11月耐用品订单环比初值、11月FHFA房价指数环比、11月S&P/CS20座大城市房价指数同比、1月24日当周初请失业金人数、11月贸易帐、12月PPI同比环比等 [7] - 将公布欧洲区2025年第四季度GDP初值、12月失业率 法国2025年第四季度GDP初值等数据 [7] - 日本央行将公布2025年12月货币政策会议纪要 加拿大央行将公布利率决议和货币政策报告 [7] 全球公司财报与行业动态 - 下周美股将迎来“超级财报周” 科技巨头微软、Meta、特斯拉、苹果及阿斯麦、IBM等轮番登场 市场焦点从单纯的营收数字转向AI资本开支的变现效率与硬件周期的复苏 [8] - 美股存储三巨头闪迪、西部数据、希捷科技与韩系双雄三星电子、SK海力士将发布最新财报 [8] - 美股石油巨头埃克森美孚和雪佛龙 港股新东方、东方甄选也将公布财报 [8] - 欧洲议会将举行“欧洲聚变能源”会议 发布欧盟聚变战略 [7] 全球地缘政治与风险事件 - 美国政府月底1月31日存在再度关门风险 市场预测平台Polymarket数据显示 受近期事件影响 美国政府在1月31日前再次关门的概率已飙升至75% [9] - 2月1日特朗普将不对欧盟加征关税 称已就格陵兰问题与北约达成“框架协议” 当前地缘局势持续紧张 美国政府的一系列非常规举动正在推高全球避险情绪 [8]
1.22犀牛财经晚报:算力市场供需失衡 “假内存”乱象滋生
犀牛财经· 2026-01-22 18:28
消费金融与信贷市场 - 多家银行个人消费贷利率处于3%-6%区间,部分银行通过贴息政策使消费者实际承担利率有望降至2%左右,甚至低于新发放住房贷款利率[1] - 某股份制银行消费贷利率约为3%,贴息1个百分点意味着个人可节省约三分之一的利息[1] 有色金属与原材料市场 - 水贝市场商户收到禁售铜条通知,要求立即停止生产、销售并下架相关产品,市场暂未发现现货铜条在售[1] - 2025年12月中国精炼铜(电解铜)产量132.6万吨,同比增长9.1%;全年累计产量1472万吨,同比增长10.4%[2] - 截至1月21日,镇江港固体硫黄成交均价为4358元/吨,较2024年末不足1600元/吨的价格上涨近180%[1] - 中国对进口硫黄的依赖度长期维持在50%左右,此轮价格上涨主因国际需求增速大于供应增速,印尼镍湿法冶炼项目等新兴产业扩张推升硫黄制酸需求[1] 半导体与电子产业 - 国内算力市场供需失衡,英伟达B200等高端GPU芯片几乎“隐形”,中低端GPU价格激升,DDR5内存条部分大容量型号涨幅超过300%,市场存在“假内存”销售乱象[2] - 1月22日国际DRAM颗粒现货价格整体稳定,DDR3 4Gb 256Mx16 1600/1866颗粒上涨2.85%,均价3.315美元[2] - 三星回应记忆体涨价传闻,否认对所有产品全面涨价80%[5] - 消息称阿里巴巴集团已决定支持旗下芯片公司平头哥未来独立上市,阿里方面未作评论[5] - 复旦大学科研团队成功研制“纤维芯片”,在柔软高分子纤维内实现大规模集成电路制备,实验室初步实现规模制备,芯片电子元件集成密度达10万个/厘米[4] 显示与面板产业 - 2025年全球工业显示面板厂商实现营收34亿美元,同比增长24%,尽管出货量同比略降0.4%[3] 新能源与储能产业 - 最新光伏电池片报价出现尝试性上涨,Topcon183N、210RN、210N电池片价格为0.4-0.42元/W,市场已出现0.45元/W的尝试性报涨,市场成交均价在0.4-0.41元/W[3] - 最新一周光伏电池片上游库存开始降低,市场回暖动力主要来自海外需求增长[3] - CNESA预计,2026年至2030年中国新型储能行业保守与理想场景的年均复合增长率分别为20.7%和25.5%,保守场景下2030年累计装机有望达到3.7亿千瓦以上,理想场景下有望达到4.5亿千瓦以上[4] 上市公司资本开支与项目进展 - 宏昌电子“年产8万吨电子级功能性环氧树脂项目”已完成建设,试生产期限为2026年1月21日至2026年7月20日[7][8] - 崇达技术控股子公司普诺威拟投资10亿元建设端侧功能性IC封装载板项目,总工业固定资产投资8亿元,建设期预计从2026年5月至2028年9月[9] - 华菱钢铁子公司华菱涟钢拟投资4.5亿元实施焦化厂6m焦炉原地大修项目,建设期19个月[10] 上市公司业绩预告 - 兴齐眼药预计2025年归母净利润为6.62亿-7.49亿元,同比增长95.82%-121.56%[11] - 广哈通信预计2025年归母净利润9000万-9700万元,同比增长21.83%-31.31%[12] - 特一药业预计2025年净利润为7000万-9000万元,同比增长241.55%-339.13%[13][15] - 金陵饭店预计2025年归母净利润为5500万-6350万元,同比增长65.37%-90.93%[14] - 深南电A预计2025年净利润为1.5亿-1.8亿元,同比增长584.66%-721.59%[16] 科技与互联网 - 腾讯回应禁止第三方导出微信聊天记录,称部分开源项目通过逆向工程等手段绕过加密措施,威胁用户隐私和客户端安全,大部分相关项目在平台沟通后已主动移除违规内容[5] 资本市场与个股动态 - 姚振华及深圳市宝能投资集团有限公司等新增6条被执行人信息,执行标的合计6.9亿余元[6] - 罗永浩持有的锤子科技(成都)股份有限公司股权被冻结,冻结股权数额超过713万元,冻结期限自2026年1月20日至2029年1月19日[7] - 1月22日A股市场午后震荡回升,创业板指涨1.01%,沪深两市成交额2.69万亿元,较上一交易日放量910亿元,全市场超3500只个股上涨[17] - 盘面上商业航天概念爆发,近二十只成分股涨停;机器人、油气、煤炭、PCB概念表现活跃;保险、半导体、医药等板块跌幅居前[17]
AI人工智能ETF(512930)涨超1.4%,谷歌将上市TPUV7重塑AI芯片竞争格局
新浪财经· 2025-12-19 13:27
市场表现 - 截至2025年12月19日13:03,中证人工智能主题指数(930713)上涨1.59% [1] - 指数成分股均胜电子(600699)上涨7.92%,德赛西威(002920)上涨7.38%,新易盛(300502)上涨4.56% [1] - AI人工智能ETF(512930)上涨1.43%,最新价报2.13元 [1] 核心驱动事件 - 谷歌即将正式上市第七代TPU芯片“Ironwood”(TPU v7) [1] - 该芯片单芯片峰值算力达到4614 TFLOPs(FP8精度),配备192GB HBM3e内存,内存带宽高达7.4TB/s,功耗约1000W [1] - 与前代产品相比,Ironwood的算力提升了4.7倍,能效比达到每瓦29.3 TFLOPs,是前代产品的两倍 [1] - 谷歌TPU v7芯片在峰值算力、内存带宽等关键指标上已比肩英伟达B200 [2] 行业影响与机遇 - 谷歌TPU v7聚焦AI推理场景并采用100%液冷架构,有望显著降低大模型推理成本 [2] - 随着谷歌云加速商业化部署,Meta等海外巨头计划通过租用方式接入算力,将进一步推动ASIC芯片及其配套产业链需求增长 [2] - 相关发展将带动液冷、电源、PCB等产业链环节 [2] 相关指数与产品 - AI人工智能ETF(512930)紧密跟踪中证人工智能主题指数 [2] - 中证人工智能主题指数选取50只业务涉及为人工智能提供基础资源、技术以及应用支持的上市公司证券作为指数样本 [2] - 截至2025年11月28日,中证人工智能主题指数前十大权重股合计占比63.92% [2] - 前十大权重股包括中际旭创、新易盛、寒武纪、中科曙光、澜起科技、科大讯飞、海康威视、豪威集团、金山办公、浪潮信息 [2]
中国银河证券:谷歌(GOOGL.US)将上市TPUv7 重塑AI芯片竞争格局
智通财经· 2025-12-19 09:35
文章核心观点 - 谷歌即将上市的TPU v7(Ironwood)芯片技术指标比肩英伟达B200,其上市将加剧AI芯片市场竞争,并有望提升谷歌自身AI芯片市占率 [1] - TPU v7的推出将全面推动AI产业从硬件到软件生态的全产业链变革,自上而下带动上游环节需求,并为AI模型研发与应用普及注入动力 [2] - 随着谷歌TPU v7的上市,国内液冷、电源、PCB领域有望迎来新的发展机遇,同时国产算力芯片在国产替代趋势下长期上行 [1] 谷歌TPU v7产品技术细节 - 芯片名称为“Ironwood”,单芯片峰值算力达到4614 TFLOPs(FP8精度),配备192GB HBM3e内存,内存带宽高达7.4TB/s,功耗约1000W [1] - 与前代产品相比,Ironwood的算力提升了4.7倍,能效比达到每瓦29.3 TFLOPs,是前代产品的两倍 [1] - 服务器散热采用100%液冷架构,采用大冷板设计,覆盖4颗TPU及VRM;集群规模上最大支持144个机架互联,即9216个TPU芯片集群 [1] TPU v7的应用场景与客户 - TPU v7聚焦AI推理场景,支持实时聊天机器人、智能客服、智能驾驶等低延迟需求,同时可扩展至大规模模型训练 [2] - Anthropic计划用百万颗TPU训练Claude系列模型 [2] - Meta拟从2027年起在数据中心部署TPU,2026年通过谷歌云租用算力 [2] - 谷歌自身将TPU v7用于Gemini等模型的训练与服务,其超大规模集群能力与低成本优势正成为AI企业降低推理成本的首选方案 [2] 对产业链的影响与机遇 - TPU v7的上市将自上而下带动ASIC芯片、PCB、封装、HBM、光模块、散热、制造封装等上游环节需求 [2] - 随着明年谷歌TPU v7的上市,国内液冷、电源、PCB领域有望带来新的发展机遇 [1] - 随着AI芯片竞争格局不断深化,国产算力芯片在国产替代趋势长期上行 [1] 行业竞争格局展望 - 未来AI芯片的市场竞争将更加激烈,谷歌有望凭借TPU v7系列产品提升自身AI芯片市占率 [1][2] - 除芯片外,谷歌还同步推出一系列升级,旨在让其云服务更便宜、更快、更灵活,以便与亚马逊AWS和微软Azure竞争 [2]
昇腾950全解 全新自研HBM
2025-12-16 11:26
涉及的行业与公司 * 行业:人工智能芯片、高带宽内存、半导体制造与封装 * 公司:华为、英伟达 核心观点与论据 * **华为昇腾950系列芯片规划** * 华为昇腾950系列芯片计划于2026年推出,支持中低端精度,分为950PR和950DT两个版本,分别对标HBM2~2E和HBM3水平[1] * 950采用两个计算带和两个IO带通过Crossbar L连接的结构,与由两个910B拼接的910C结构不同[2] * 950在FP8精度下算力约为1,000 TFLOPS,高于920C的FP16算力(约800 TFLOPS),但整体算力仍不及920C[2] * **华为未来芯片发展方向** * 未来发展方向是提升互联带宽和内存容量以增强整体性能[1] * 后续产品960将达到9.6TB/s的内存带宽,与英伟达B200相当[1][4] * 通过增加IO面积来提高互联带宽,但受限于国内制程技术,其增长速度可能放缓[1][4] * **华为自研IO单元与连接能力** * 自研IO单元具备较强连接能力,NPU IO能力达到72路UB(每路UB约30GB/s)[1][5] * 拥有低基数交换机LIS(72路UB)和高维度交换机HRS(512路UB),通过拼接可形成更大面积的交换芯片[1][5] * LIS由两个IO带拼接而成,总面积约400平方毫米以上[5] * **华为自研HBM技术路线** * 第一代自研HBM代号“白鹭”,计划2026年上半年推出,采用8个堆叠,每个堆叠16GB容量和204GB/s带宽,对标HBM2到HBM2E[3][10] * 第二代自研HBM代号“朱雀”,计划2026年下半年推出,将搭配950DT使用,可能采用6、8或12个堆叠,每个堆叠24GB容量和683GB/s带宽,对标HBM3[3][10] * **选择定制化HMC而非标准化HBM的原因** * 增强供应链自主可控,避免对海外高端HBM的依赖[11][13] * 有利于功耗管理,将HMC放置在离计算带稍远的位置以降低热量对存储单元的影响[11][13] * 成本控制,HMC通过ABF载板连接的成本低于需要通过中介层互联的HBM[11][13] * **国产芯片与英伟达的差距与竞争态势** * 在算力方面,预计到2028年的华为970芯片才能与英伟达B200持平[1][7][8] * 英伟达Ruby系列芯片因制程优势明显,国产芯片难以快速追赶[1][8] * 若英伟达H200进入国内市场,国产算力芯片在单芯片性能上难以直接竞争,可能需要两到三年时间通过新产品迭代追赶[9] * 超级点架构可能是国产芯片与H200抗衡的重要手段,该架构将显著增加对交换机芯片的需求[1][9] * **国产GPU及配套产业链发展趋势** * 预计2026年将是国产GPU出货量大增的一年[3][14] * 以华为950为例,每颗芯片搭配8个自研HBM,若其出货量达到100万颗,则需800万颗以上的HBM[14] * 国产HBM的放量将显著受益封装材料、焊球、电镀液等相关产业链,并增加用于封装后的APO载板需求[3][14] * 2026年可能是国产HBM放量元年[14] 其他重要内容 * **华为芯片产能消耗估算** * 一个计算带面积约400平方毫米,一个HBM模块超过150平方毫米,一个IO模块约100多平方毫米[6] * 结合良率估算,一片晶圆可切出18颗NPU代、17颗I/O代、9个HRS以及70颗CPU[6] * **HBM与HMC的技术差异** * 核心架构:HBM通过中介层实现高密度集成,HMC可放置在离CPU/GPU较远的位置通过线路连接[12] * 性能:HBM具有极高带宽和低时延,HMC因物理距离远导致延迟略高[12] * 功耗与集成度:HBM功耗较低且结构紧凑,HMC相对功耗密度较弱[12] * 成本:HBM因需要中介层互联而成本更高;HMC通过ABF载板连接成本更低,但线宽线距要求更高[12]
英伟达H200如果放开,中国会接受吗?
傅里叶的猫· 2025-11-22 23:21
H200可能放开的背景与现状 - 关于H200放开的传闻最早由彭博社报道,描述为“初步讨论”阶段,存在仅停留在讨论层面而永不落地的可能性[1][2][3] - 此次讨论源于此前中美领导层会晤,市场曾预期更先进的Blackwell架构芯片会放开,但最终未谈及,据华尔街日报消息是因美方高级顾问反对[4][7] - 高端Hopper架构芯片的放开事宜可能已讨论较长时间[9] H200性能规格与市场定位 - H200基于Hopper架构,相比H100在GPU内存(从80GB HBM3提升至141GB HBM3e)和内存带宽(从3.35 TB/s提升至4.8 TB/s)上有显著升级,热设计功耗最高达1000W[10][11] - 在双精度浮点运算(FP64 Tensor Core)性能上,H200与H100保持一致,均为33.5 TFLOPS,但在特定高精度计算场景下其FP64 Tensor Core算力(67 teraFLOPS)强于B200(37 teraFLOPS)[10][19] - H200的单卡算力和显存带宽被认为高于国内AI芯片[13] 海外云服务市场对H200的使用与定价 - 美国主要云服务供应商(如GOOGL、AMZN、META、MSFT)的服务器折旧年限多在4至6年,H100和H200均处于正常使用周期[13][14] - 在Coreweave租赁平台,H200的每小时使用价格为3.50美元,略低于B200的5.50美元,但高于H100的2.95美元[15] - 在AWS和GCP上,H200的定价甚至高于B200,反映出其在特定场景的适配性更强及资源稀缺性[16][18] - H系列芯片在海外云服务器中使用率很高,部分原因是大量“遗留负载”迁移成本高昂,此情况同样存在于国内云服务提供商[20][21] 对中国市场潜在影响的判断 - 基于H200在海外的高使用率及其性能特点,分析认为若美国真的放开H200出口,中国方面基本会予以放行[22] - 此前H20放开后因“后门问题”已被禁止采购,同时证明国内已具备可替代H20的AI芯片能力[13] 英伟达国内供应链信息更新 - 文章梳理了英伟达在国内液冷和电源产业链的相关上市公司信息,涉及企业包括英维克、思泉新材、科创新源、淳中科技、鼎通科技、麦格米特、京泉华、金盘科技、四方股份等[24] - 表格列出了各公司的出货产品、产品市占率、供货方式、产品毛利率及2026年订单交付预期等关键数据[24]
国产推理芯片,赢了英伟达?
雷峰网· 2025-11-19 14:38
文章核心观点 - 算力市场的投资逻辑正从英伟达等国际厂商向国产算力切换,其驱动力包括高额补贴政策、国产芯片技术成熟度提升、以及推理等特定场景的性价比优势 [1][2] - 国产算力在政策支持下已具备商业化可行性,一二级市场热情高涨,而英伟达设备贸易则因利润微薄和信任危机遇冷 [2][3][4] - 国产芯片正步入卖方市场,其独特的直销模式、产能限制以及推理需求的爆发共同推动了市场的快速增长 [18][19][20] 政策支持与补贴 - 北上深杭等承担国家人工智能发展任务的城市,国产算力项目可享受40%的国家全额补贴,叠加地方政府补贴后最高可达项目总投入的70%-80% [8] - 八大算力节点城市可获得10%-15%的基础补贴,叠加超长期国债与地方补贴后,力度最高可达40% [8] - 为杜绝套壳骗补,补贴要求消纳方为互联网大厂等指定主体或在当地注册并形成一定规模的企业,以带动当地GDP增长和税款 [9] - 最新“窗口指导”文件要求有补贴参与的项目需全部使用国产芯片,部分已开工但进度较低的项目需拆除已使用的国外芯片 [9] 国产算力商业化进展 - 科大讯飞与华为联合打造的国产算力集群在MoE模型训练上实现93%的效率 [3] - 中科院部署了4096张沐曦算力卡,共计984P算力 [3] - 蚂蚁集团已部署万卡规模的国产算力集群,训练任务稳定性超过98% [3] - 一级市场融资活跃,曦望完成近10亿元人民币Pre-A轮融资,昉擎科技完成数亿元人民币天使轮融资 [4] - 二级市场算力及半导体板块领涨,中证半导体产业指数近三个月上涨42.48%,寒武纪、海光信息等企业股价年内翻倍 [4] 技术迭代与场景适配 - 国产芯片已完成2-3代产品迭代,达到可对标英伟达主流卡水平 [12] - 推理需求爆发式增长,火山引擎豆包大模型日均Token用量从2024年5月的1200亿飙升至2025年9月的30万亿,增幅达253倍 [13] - 2028年中国推理算力市场规模将达2931.2亿元 [13] - 推理任务的技术特性(如Decoder架构、局部计算)无需追求极致计算性能,为国产芯片提供了精准适配空间 [14][15] - 华为基于910B推出专家并行方案,显著降低单卡显存占用并将单卡并发能力提升至3倍 [16] - 异构集群应用成熟,天数智芯天垓150与英伟达H20组成的集群已成功应用于DeepSeek的大规模推理场景 [17] 市场格局与渠道变化 - 英伟达设备贸易利润急剧下滑,一张4090显卡利润仅约200元,而2023年一台A100转手可赚十万元 [4] - 国内AI芯片市场正进入高速增长通道,年增长率判断在50%,甚至有望达到70%-80% [20] - 国产芯片销售以“公对公”直销模式为主,头部厂商采用白名单机制仅向大型企业及国企开放合作 [21] - 芯片原厂主导销售与技术服务,服务器厂商(如浪潮、新华三)负责硬件组装但技术支持能力不及原厂 [22] - 服务器厂商对通用性较低的国产芯片备货审慎,导致市场流通货源减少,国产芯片逐步走入卖方市场 [23] 竞争态势与未来趋势 - 国产芯片商业化落地窗口期短,若一年内未能形成批量采购则意味着落地不成功 [26] - 超节点产品崛起,通过优化互联链路与架构实现整体性能弯道超车,例如昇腾384超节点支持数万卡集群扩展 [26][27] - 头部厂商单套超节点产品落地价约7000-8000万元,为加速市场渗透部分项目折扣力度可达五折 [28] - 国产AI芯片软件生态仍处于“各立标准”的分散状态,模型迁移需1-3个月适配周期,生态统一标准是未来突破关键 [29]
英伟达最强对手,来了
半导体行业观察· 2025-11-07 09:00
TPU v7 (Ironwood)性能突破 - 谷歌最新一代Ironwood TPU加速器性能实现重大飞跃,性能是TPU v5p的10倍,是TPU v6e"Trillium"的4倍 [4] - 单个Ironwood TPU提供4.6 petaFLOPS的密集FP8性能,略高于英伟达B200的4.5 petaFLOPS,略低于GB200/GB300的5 petaFLOPS [3] - 计算平台配备192GB HBM3e内存,提供7.4 TB/s带宽,与英伟达B200(192GB HBM,8TB/s内存带宽)处于同一水平 [3] - 每个TPU具有四个ICI链路,提供9.6 Tbps总双向带宽,而英伟达B200/B300为14.4 Tbps (1.8 TB/s) [3] 大规模扩展架构优势 - 谷歌TPU以Pod形式提供,单个Ironwood模块可通过专有互连网络连接多达9216个独立芯片 [7] - 9216颗芯片共享1.77PB高带宽内存,互连带宽高达9.6 Tbps,相当于在不到两秒内下载整个美国国会图书馆 [7] - 采用光路交换技术构成动态可重构架构,组件故障时可在几毫秒内自动绕过中断点,保持工作负载运行 [7] - 液冷系统整体正常运行时间保持约99.999%可用性水平,相当于每年停机时间不到6分钟 [8] - 采用3D环面拓扑结构,每个芯片以三维网格形式连接其他芯片,无需使用高性能数据包交换机 [8] Axion CPU战略布局 - 谷歌部署首款基于Armv9架构的通用处理器Axion,基于Arm Neoverse v2平台构建 [11] - Axion旨在比现代x86 CPU提升高达50%性能、高达60%能效,比云端最快通用Arm实例性能高30% [11] - 该CPU每个核心配备2MB私有L2缓存,80MB L3缓存,支持DDR5-5600 MT/s内存和统一内存访问 [11] - 早期客户Vimeo报告核心转码工作负载性能提升30%,ZoomInfo在Java服务上性价比提升60% [12] 软件生态系统与生产力 - AI超级计算机客户平均实现353%三年投资回报率,降低28% IT成本,提高55% IT团队效率 [14] - 谷歌Kubernetes Engine为TPU集群提供高级维护和拓扑感知功能,实现智能调度和高弹性部署 [14] - 开源MaxText框架支持监督式微调和生成式强化策略优化等高级训练技术 [14] - 推理网关通过前缀缓存感知路由等技术,将首次令牌延迟降低96%,服务成本降低高达30% [14] - 推理网关监控关键指标并智能路由请求,对共享上下文的请求路由到同一服务器以减少冗余计算 [15] 行业竞争格局与客户采用 - Ironwood Pods的FP8 ExaFLOPS性能被谷歌称为是其最接近竞争对手的118倍 [7] - 谷歌TPU v4支持最大4096芯片POD,TPU v5p提升至8960芯片,Ironwood进一步达到9216芯片 [16] - Anthropic计划利用多达一百万个TPU来训练和运行其下一代Claude模型 [16] - 亚马逊Trainium 2加速器在其计算结构中也采用2D和3D环面网格拓扑结构 [16]
IREN(IREN.US)签署多年期AI云合同,GPU部署助推营收潜力超5亿美元
智通财经· 2025-10-07 20:33
公司业务发展 - 公司与多家人工智能企业签署额外的多年期云服务合同,涉及英伟达Blackwell系列GPU的部署[1] - 公司近期已扩大其AI云服务产能,计划到2026年第一季度末,使当前运营及已订购的2.3万台GPU实现年化运营收入超5亿美元[1] - 在2.3万台GPU中,已有1.1万台的客户合同落地,对应AI云服务年化经常性收入约2.25亿美元,这批GPU预计将于2025年底前投入运营[1] - 公司两周前宣布斥资约6.7亿美元采购英伟达和AMD的GPU,以加速其人工智能云业务增长[1] 公司财务表现 - 截至2026年第一季度末,公司2.3万台GPU有望实现年化运营收入超5亿美元[1] - 已签约的1.1万台GPU对应AI云服务年化经常性收入约2.25亿美元[1] - 公司近期GPU采购总价值约6.74亿美元,包括7100台英伟达B300 GPU、4200台英伟达B200以及1100台AMD MI350X[1] 公司市场表现 - 该消息推动公司股票在美股盘前一度上涨12%,截至发稿时上涨7%[1] - 两周前宣布大规模GPU采购的消息曾引发公司股价大涨超10%[1] 行业动态 - 公司作为数据中心运营商兼比特币矿企,正积极向人工智能云服务业务拓展[1] - 公司大规模采购英伟达和AMD的高性能GPU,反映了行业对AI计算能力的强劲需求[1]