Workflow
NVIDIA H200
icon
搜索文档
国内算力斜率仍在抬升
国金证券· 2026-03-14 23:27
行业投资评级 * 报告未明确给出行业投资评级 [7][8][59] 核心观点 * 报告核心观点认为,2026年将是中国算力需求从“云端训练”向“训练+推理”双轮驱动转型的关键之年,算力缺口将极速释放 [6] * 在供需双侧强逻辑驱动下,2026年算力产业链将进入“全链通胀”周期,行业景气度将从核心芯片向AIDC、云服务、配套设备等环节全面外溢,有望实现量价齐升 [6][50] 一、Oracle智算ROI兑现,腾讯云提价验证需求 * **Oracle业绩超预期,智算云拐点显现**:甲骨文FY26Q3总营收171.90亿美元,同比增长21.66%,云业务收入同比增长44%至89.14亿美元,其中OCI业务收入同比高增84%至48.88亿美元 [11] * **AI基础设施收入与合同额暴增**:FY26Q3公司AI基础设施建设收入同比大增243%,通过创新交易模式新增290亿美元合同,期末剩余履约义务(RPO)高达5530亿美元,同比增长325% [6][12] * **腾讯云开启AI模型提价周期**:腾讯云自2026年3月13日起调整部分模型计费策略,混元系列模型价格上调超400%,标志着云计算服务商因AI算力供需剪刀差扩大而开启提价周期 [6][17] 二、训推共振,算力需求极速释放 * **训练侧:向高质量与多模态进阶**:头部互联网厂商持续迭代万亿参数模型,AI新势力快速更新MoE架构,Scaling-law在多模态领域延续,以字节跳动Seedance 2.0为代表的视频生成模型推动算力需求向高消耗的视频/3D训练跃迁 [6][19][20] * **推理侧:应用落地元年,需求斜率陡峭**:2026年为AI应用落地元年,C端流量与原生场景爆发,如豆包APP在2025年12月MAU已突破2.26亿,驱动实时推理算力消耗大幅增长,推理侧需求将成为产业链增长新引擎 [6][33][35] * **AI原生应用成为爆款**:AI漫剧、AI编程等原生应用快速爆发,例如2025年度抖音播放量TOP1的《斩仙台下,我震惊了诸神》为AI漫剧,累计播放量达10.6亿次 [34][36] * **AI编程与医疗赛道突破**:OpenAI推出的编码助手Codex首周下载量超100万次,蚂蚁集团“蚂蚁阿福”升级为“AI健康伙伴”后冲至苹果应用商店总榜TOP3,验证了垂直赛道的高需求与高壁垒 [38][40] 三、供给端外部边际改善,内部国产化加速放量 * **外部供给边际改善**:NVIDIA H200(合规版)已正式获批进入中国市场,短期内将缓解头部厂商在超大规模模型训练上的算力焦虑 [6][43] * **国产算力芯片跨过“可用”向“好用”拐点**:华为昇腾、寒武纪思元、海光深算等系列产品在实战中快速迭代,性能已基本追平H20、A100等产品,大厂自研芯片进入大规模部署阶段 [6][44] * **上游产能提供保障**:中芯国际2025年Q4营收24.89亿美元,环比增长4.5%,在新增1.6万片12英寸晶圆产能的基础上,产能利用率保持在95.7%,先进制程产能扩充为芯片供应提供底层保障 [6][45] * **CSP厂商加速生态适配**:腾讯云等云计算服务商宣布全面适配主流国产芯片,推动“芯片-模型-应用”闭环形成,助力国产芯片生态建设 [47][48] 四、国产算力全链通胀,有望量价齐升 * **AIDC投建力度持续高景气**:硅谷四大科技巨头(亚马逊、Alphabet、Meta、微软)2026年资本开支合计将高达约6500亿美元,AI军备竞赛加剧,中国智能算力规模预计从2020年的75.0 EFLOPS增长至2028年的2,781.9 EFLOPS,年复合增长率达57.1% [52] * **产业链开启涨价周期**:自25Q4起,部分CPU大厂已步入涨价周期,英特尔、AMD计划将服务器CPU价格提高多达15%,亚马逊AWS、谷歌云、智谱AI等算力/云厂商也相继宣布提价,幅度在15%-30%以上 [53] 五、相关标的 * 报告列举的相关标的包括:东阳光、寒武纪、海光信息、润泽科技、利通电子、豫能控股、协创数据、华丰科技、大位科技、网宿科技、神州数码、云天励飞、润建股份、亿田智能、科华数据、中芯国际、华虹半导体、中科曙光、禾盛新材、奥飞数据、优刻得、首都在线、云赛智联、瑞晟智能、浪潮信息、潍柴重机、欧陆通等 [4][56]
半导体-中国 AI GPU:加速追赶美国技术-Greater China Semiconductors-China AI GPUs – Closing the Gap with the US
2026-03-12 17:08
涉及的行业与公司 * **行业**:大中华区半导体行业,特别是人工智能图形处理器(AI GPU)领域[1] * **公司**: * **AI GPU 设计公司**:华为(Ascend)、寒武纪、燧原科技、摩尔线程、壁仞科技、天数智芯、瀚博半导体、昆仑芯(百度)、平头哥(阿里巴巴)、字节跳动(ASIC)[6][35][53][233] * **半导体供应链**:中芯国际(SMIC,晶圆代工)、北方华创(NAURA,设备)、ASM Pacific(先进封装)[6] * **互联网平台**:百度(含昆仑芯)、阿里巴巴(含平头哥)、腾讯、字节跳动[6][35][131] 核心观点与论据 1. 市场前景:需求强劲,自给率提升,但面临同质化风险 * **市场规模与增长**:预计中国AI芯片总潜在市场将从2024年的191亿美元增长至2030年的670亿美元,年复合增长率达23%[10][11][115][133][140]。其中,本地AI芯片收入预计将从2024年的60亿美元增至2030年的510亿美元,年复合增长率为42%[115][147]。 * **自给率提升**:预计中国AI GPU自给率将从2024年的33%提升至2030年的76%[19][20][115][146][148][149]。预计到2027年,本地芯片价值将超过美国芯片[151]。 * **需求驱动**:需求由商业应用(云服务提供商、AI应用)和政策驱动的“主权AI”需求共同推动[45][115][117]。主要买家包括CSP(字节跳动、阿里巴巴、腾讯)、电信运营商、国企和政府[131][132]。 * **风险**:随着代工产能可能从2027年开始扩张以及AI GPU设计成熟,产品差异化可能变得困难,行业存在利润率下降和未来两到三年整合的风险[42][255]。 2. 供应链:取得进展,但瓶颈依然存在 * **代工产能**:预计中国先进制程产能(12nm及以下)将增加[12]。中芯国际的N+2(7nm)产能预计从2025年的约2.2万片/月增至2027年的约5.1万片/月[86][97]。然而,产能高度集中,且需与智能手机、汽车SoC等需求竞争[84][86]。 * **关键瓶颈**: * **设备与EDA**:在光刻、检测和计量工具方面持续受限[78]。国内EDA厂商华大九天全球市场份额仅约1-2%,缺乏支持先进节点GPU设计的全流程工具[80]。 * **制造策略**:由于先进节点获取受限,国内厂商采用多芯片封装、扩大机架集群、扩大制造产能等系统级和架构策略来弥补单芯片性能劣势[93][96][98][99][100]。 * **“合规”芯片**:台积电和三星等海外代工厂可能为符合美国出口管制(ECCN 3A090)的中国设计公司生产“合规”芯片[146][219][220]。例如,字节跳动通过芯原微电子的设计服务模式在三星生产低性能推理芯片[39][220]。 3. 竞争力分析:在推理场景已具竞争力,系统级创新缩小差距 * **性能差距**:在芯片层面,中国比美国落后约1.5-2代,但系统级性能差距正在缩小[136]。在性能/瓦特/美元框架下评估,差距显著缩小,特别是在中国对功耗敏感度较低的情况下[34][73][74][271]。 * **推理经济性占优**: * **总拥有成本**:国内AI加速器的TCO可比在中国可获取的英伟达解决方案低30-60%,得益于较低的芯片价格和电力成本[34][169][178]。 * **单次推理成本**:国内领先加速器(如华为、寒武纪)的单次推理成本已可与英伟达H20和A100相媲美,甚至在某些配置下更优[176][177][178]。 * **代币输出性能**:在DeepSeek R1推理基准下,华为昇腾950PR和寒武纪MLU690的TPS可能比英伟达H20高出约50-150%[179][190]。 * **系统级优势**:中国在服务器系统、光网络、数据中心空间、电力供应和政策支持方面具有优势[37][274][276]。国内平台在计算与网络带宽比率上更为平衡,可能减少系统级低效[110]。 * **长期挑战**:在大型AI模型训练方面,英伟达仍占主导地位[32]。国内加速器要切入训练市场并最终找到海外买家,仍是长期关键问题[32]。 4. 行业格局:当前碎片化,未来将整合 * **市场集中度**:2026年国内GPU市场,华为预计占据63%份额,寒武纪占10%,昆仑芯和平头哥各占约7-8%[53][233][245]。预计华为份额在2026-2030年将保持50%以上[150][152]。 * **玩家类型**:包括商业供应商(如寒武纪、燧原)、 captive设计部门(如百度昆仑芯、阿里平头哥)和主权支持玩家(如华为)[35][46][256]。 * **整合压力**:主要客户(CSP、电信运营商)有动力支持至少一家主权背景供应商和自家关联设计部门,这限制了独立第三方供应商的市场空间[42][256]。预计未来两到三年将出现整合[42][255]。 5. 估值:高市销率反映期权价值,而非当前盈利 * **高估值倍数**:中国AI半导体设计公司的市销率远高于全球同行,尽管收入基础小得多,盈利阶段更早[47][48][227]。例如,寒武纪2026年预期市销率约32倍,燧原科技约60倍,摩尔线程约139倍[51][54][228][235]。 * **估值驱动**:高估值反映了在地缘政治限制下的国内替代期权、政策支持、战略资本配置以及产能正常化和软件生态系统成熟的凸性上行空间[222][223]。 * **具体公司估值**: * **昆仑芯**:估值200亿至610亿美元,基于2026年预期市销率20-33倍[56][57][237][238]。 * **平头哥**:估值280亿至860亿美元,基于2026年预期市销率20-33倍[59][62][246][247]。 * **与美企对比**:英伟达和AMD 2026年预期市销率分别为约17倍和25倍,由规模、已证实的盈利能力和清晰的多年需求前景支撑[224][225][228]。 其他重要内容 1. 政策与商业化的双重驱动 * 政策支持加速了早期发展,但长期价值取决于商业竞争力[5]。政府支持在规模化阶段锚定了供应形成和国内需求[140][141]。 * 商业化回报成为越来越重要的需求驱动力,AI相关资本支出需要可论证的商业回报来维持[122][123]。主要科技公司的AI相关资本支出预计在2026年将同比增长38%,达到5970亿元人民币[123]。 2. 情景分析 * **基本情景**:海外流片受限,中芯国际持续扩张产能但受设备限制,H200出口有限。政策支持推动本地AI加速器需求增长[66][67][154]。 * **乐观情景**:国内AI芯片供应条件显著改善,获得领先代工服务的渠道改善或中芯国际良率提升,美国先进AI加速器出口持续受限[68][154]。 * **悲观情景**:设备限制进一步收紧,严重制约先进节点产能扩张。同时,英伟达H200出口管制放松,降低了国内替代的紧迫性[69][70][154]。 3. 电力成本优势 * 中国享有比全球其他经济体低得多的电力价格[173][174][283]。较低的芯片价格加上较低的电力成本带来了更低的单次推理成本[175]。 * 数据中心电力需求预计在2025-2035年以约22%的年复合增长率增长[277]。充足的电力供应和低廉的电价增强了中国在AI计算方面的系统级竞争力[284]。 4. 技术指标对比 * 报告引入了总处理性能(TPP)和性能密度(PD)等指标来评估芯片性能。一些国内设计(如华为昇腾910C/950、寒武纪MLU690)在TPP上已达到或超过英伟达A100级别[208][210][211]。部分国内设计由于芯片尺寸更小,PD甚至超过英伟达A100[213][216][217]。 * 详细对比了中美AI芯片在晶圆前端、芯片封装、内存、服务器系统、光网络、软件优化、数据中心空间、电力供应和政策支持等九个方面的竞争力[37][274][276]。
计算机行业研究:国内算力斜率陡峭到什么程度?
国金证券· 2026-02-28 21:43
行业投资评级 * 报告未明确给出具体的行业投资评级(如买入、增持等)[7] 报告核心观点 * 报告核心观点是:2026年将是中国算力需求从“云端训练”向“训练+推理”双轮驱动转型的关键之年,在供需双侧强逻辑驱动下,算力产业链将进入“全链通胀”周期,行业景气度将从核心芯片向产业链上下游全面外溢[6] 分章节内容总结 一、开年即“熔断”,从Seedance排队到GLM5“交错思维” * **Seedance 2.0排队现象**:2026年春节复工后,Seedance 2.0视频生成模型出现长时间排队,普通会员生成10秒以内视频需排队6小时以上,节后甚至需8小时起步,排队人数达上万人[11]。这印证了视频生成对算力的高强度消耗,基于DiT架构的视频推理对显存带宽与并发计算要求呈指数级跃升,头部厂商算力储备面临短期压力[12] * **GLM-5“交错思维”机制**:智谱AI上线的GLM-5模型明确“交错思维(Interleaved Thinking)”机制,在输出最终答案前需在后台进行多次自我推演,包含海量隐式计算(Hidden Tokens)[13]。这意味着单次推理任务的算力消耗将成倍提升,开启了“以算力换智能”的新范式[6][13] 二、训推共振,算力需求极速释放 * **训练侧需求**:头部互联网厂商(字节、阿里、腾讯)持续迭代万亿参数级模型,智谱、DeepSeek等新势力快速更新MoE架构[6]。Scaling-law在多模态领域延续,以Seedance为代表的模型推动算力需求从单一文本向高消耗的视频/3D训练跃迁[6]。例如,字节跳动豆包大模型2.0、音视频创作模型Seedance 2.0、图像创作模型Seedream 5.0 Preview于2026年2月集中发布[17] * **推理侧需求**:2026年被视为AI应用落地元年,推理侧需求正以超预期的斜率上升[6][32]。根据QuestMobile数据,豆包APP 2025年12月月活跃用户(MAU)已突破2.26亿[6]。AI漫剧、AI编程等原生应用快速爆发,例如2025年抖音累计播放量TOP100漫剧中,AI漫剧和动态漫合计占比45%,其中榜首AI漫剧《斩仙台下,我震惊了诸神》累计播放量达10.6亿次[33][35]。OpenAI推出的编码助手Codex独立App,上线第一周下载量超过100万次[37] 三、供给端外部边际改善,内部国产化加速放量 * **外部供给改善**:根据相关贸易许可清单更新,NVIDIA H200(合规版)已正式获批进入中国市场,短期内将有助于缓解头部互联网厂商在大模型训练上的算力焦虑[6][42] * **国产算力崛起**:国产算力芯片的性能与生态建设已跨过“可用”向“好用”的拐点[6]。华为昇腾系列、寒武纪思元系列、海光深算系列快速迭代;百度昆仑芯、阿里平头哥及字节跳动自研芯片开始大规模部署;摩尔线程、沐曦、天数智芯等初创厂商加速推进IPO进程[6]。国产GPU在算力指标上,多数主流产品处于英伟达A100阶段,少数接近H100水平[43] * **上游产能保障**:中芯国际2025年第四季度营收为24.89亿美元,环比增长4.5%;在当季增加1.6万片12英寸晶圆产能的基础上,整体产能利用率保持在95.7%,其中8英寸产能利用率超过100%,12英寸接近满载[44] 四、国产算力全链通胀,有望量价齐升 * **全链景气外溢**:报告预判2026年算力产业链将进入“全链通胀”周期,行业景气度将从核心芯片向AIDC(人工智能数据中心)、云与算力服务、配套电力设备及服务器等环节全面外溢[6][49] * **AIDC投建高景气**:硅谷四大科技巨头(亚马逊、Alphabet、Meta、微软)2026年资本开支(CapEx)合计将高达6500亿美元[51]。根据IDC数据,2020年中国智能算力规模为75.0 EFLOPS,预计到2028年将达到2,781.9 EFLOPS,2020-2028年复合增长率达57.1%[51] * **产业链价格普涨**:自2025年第四季度起,部分CPU大厂已步入涨价周期,英特尔、AMD计划将服务器CPU价格提高多达10%-15%[52]。算力/云厂商亦开始涨价,亚马逊云科技(AWS)上调其EC2机器学习容量块价格约15%,谷歌云宣布自2026年5月1日起对部分服务进行价格调整,智谱AI对GLMCoding Plan套餐价格进行结构性调整,整体涨幅自30%起[52] 五、相关标的 * 报告列举的相关上市公司标的包括:东阳光、寒武纪、海光信息、网宿科技、润泽科技、协创数据、华丰科技、大位科技、神州数码、润建股份、科华数据、中芯国际、华虹半导体、中科曙光、禾盛新材、奥飞数据、优刻得、首都在线、云赛智联、瑞晟智能、浪潮信息、潍柴重机、欧陆通等[4][55]
TrendForce:预计2026年八大主要CSP的合计资本支出将超7100亿美元 年增率约61%
智通财经网· 2026-02-25 17:14
全球AI服务器资本支出与投资趋势 - 为加速AI应用导入与升级,全球主要云端服务供应商持续加强投资AI服务器及相关基础设施,预计2026年八大主要CSP的合计资本支出将超越7,100亿美元,年增率约61% [1] - 除持续采购英伟达和超威的GPU方案外,业者也扩大导入ASIC基础设施,以确保AI应用服务的适用性及数据中心建置的成本效益 [1] 主要CSP资本支出与AI服务器策略 美系CSP - **Google (Alphabet)**: 预计2026年资本支出有望超1,783亿美元,年增高达95%,其较早投入自研ASIC并累积显著研发优势,预计2026年TPU在AI服务器出货占比将上升至逼近78%,是各CSP中唯一ASIC机种出货比例高于GPU的业者 [4] - **Amazon**: 近期上调对英伟达GB300、V200整柜系统的采购规模,以应对云端AI训练与推理服务扩张,预计2026年GPU机种在其AI服务器占比将达近60%,自研的新一代Trainium 3 ASIC预计2026年第二季起接替前代放量 [5] - **Meta**: 预计2026年资本支出将破1,245亿美元,年增77%,其AI服务器以英伟达、超威方案为主,GPU机种占比预计仍达80%以上,同时推进自研ASIC以降低算力成本并分散供应商依赖 [5] - **Microsoft**: 主要购置英伟达整柜解决方案支持AI服务器出货,并发布了自研芯片Maia 200以锁定高效率AI推理应用 [6] - **Oracle**: 为应对外部AI数据中心项目扩张,持续布局GPU整柜式方案 [6] 中系CSP - **ByteDance**: 预计其2026年一半以上资本支出将用于采购AI芯片,英伟达H200有望成为其主要方案之一,同时公司也扩大导入如寒武纪等本土AI芯片 [6] - **Tencent**: 外购英伟达等GPU方案支撑云端与生成式AI需求,同时也与当地业者合作发展ASIC自主方案,以分散算力来源并提升系统整合弹性 [6] - **Alibaba**: 通过旗下平头哥、阿里云等事业积极自研ASIC AI芯片,提供公有云及其他在线服务的AI基础设施,并开发通义千问大模型及应用软件 [7] - **Baidu**: 规划于2026年后陆续导入Kunlun新方案,锁定大规模AI训练或推理应用,并尝试发展可连接数百颗AI芯片的AI服务器集群以强化整体运算能力 [7] AI服务器技术路径与芯片方案 - 全球CSP的AI服务器技术路径呈现多元化,包括持续采购主流GPU方案和扩大导入自研或第三方ASIC [1] - Google的TPU在其AI服务器中占比预计在2026年达到近78%,显著领先GPU方案 [4] - Amazon和Meta等公司则仍以GPU方案为主力,同时积极发展自研ASIC作为补充或未来替代 [5] - 中系CSP在采用国际GPU方案的同时,也积极推动本土AI芯片和自研ASIC的发展,以应对供应链风险并提升自主性 [6][7]
计算机行业研究:再谈国内算力斜率陡峭
国金证券· 2026-02-13 14:08
行业投资评级 * 报告未明确给出行业投资评级 [3][4][6][7][8][11][44][47] 报告核心观点 * 报告判断2026年将是中国算力需求从“云端训练”向“训练+推理”双轮驱动转型的关键之年,算力缺口将极速释放 [6] * 供给端将从单一的紧缺状态转向结构性平衡,外部NVIDIA H200(合规版)获批进入中国市场,内部国产算力芯片跨过“可用”向“好用”的拐点 [6] * 在供需双侧强逻辑挤压下,预判2026年算力产业链将进入“全链通胀”周期,行业景气度将从核心芯片向AIDC、云与算力服务、配套电力设备及服务器等环节全面外溢 [6] 一、训推共振,算力需求极速释放 * **训练侧**:大模型“军备竞赛”并未降温,头部互联网厂商(字节跳动、阿里巴巴、腾讯)密集发布万亿参数级新一代主力模型,“AI新势力”(智谱AI、DeepSeek、Minimax、科大讯飞)快速迭代MoE架构 [6][11] * **训练侧**:Scaling-law在多模态领域展现出延续性,以字节跳动发布的Seedance模型为代表,算力需求已从单一的文本训练向高算力消耗的视频/3D训练跃迁 [6] * **推理侧**:国内AI应用进入“落地元年”,推理算力需求正以超预期的斜率上升 [6] * **推理侧**:豆包APP在2025年12月的月活跃用户数(MAU)已突破2.26亿,同比增长超200% [6] * **推理侧**:通义千问上线两个月,C端月活跃用户数已突破1亿 [25] * **推理侧**:AI原生应用快速爆发,例如2025年抖音累计播放量TOP100漫剧中,AI漫剧占28%,其中《斩仙台下,我震惊了诸神》累计播放量达10.6亿次 [26] * **推理侧**:AI编程迈向原生入口,OpenAI推出的编码助手Codex独立App第一周下载量超过100万次,用户总数环比增长60% [26] * **推理侧**:AI医疗等垂类模型蓄势待发,蚂蚁集团“蚂蚁阿福”发布当日冲至苹果应用商店总榜TOP3 [29][30] 二、供给端外部边际改善,内部国产化加速放量 * **外部供给**:NVIDIA H200(合规版)已正式获批进入中国市场,短期内将有效缓解头部互联网厂商在超大规模模型训练上的算力焦虑 [6][32] * **国产芯片**:国产算力芯片(华为昇腾系列、寒武纪思元系列、海光深算系列)的性能与生态建设已跨过“可用”向“好用”的拐点 [6] * **国产芯片**:大厂自研芯片(百度昆仑芯、阿里平头哥、字节跳动自研芯片)进入大规模部署期 [6] * **国产芯片**:国内多数头部企业主流在售产品的FP16/BF16算力在100-300 TFLOPS左右,处于英伟达A100产品阶段 [33] * **上游产能**:中芯国际2025年第四季度营收为24.89亿美元,环比增长4.5%,产能利用率保持在95.7%,12英寸晶圆产能接近满载 [34] * **生态建设**:腾讯云宣布全面适配主流国产芯片,百度、阿里等企业加速适配,推动“芯片-模型-应用”闭环形成 [35][36] 三、国产算力全链通胀,有望量价齐升 * **全链景气**:预判2026年算力产业链将进入“全链通胀”周期,景气度从核心芯片向AIDC、云与算力服务、配套电力设备及服务器等环节全面外溢 [6][38] * **AIDC投建**:硅谷四大科技巨头(亚马逊、Alphabet、Meta、微软)2026年资本支出合计将高达6500亿美元,其中亚马逊目标2000亿美元,Alphabet计划1750-1850亿美元,Meta预计1350亿美元,微软财年资本支出预计逼近1050亿美元 [40] * **AIDC投建**:中国智能算力规模预计从2020年的75.0 EFLOPS增长至2028年的2,781.9 EFLOPS,2020-2028年复合增长率达57.1% [40] * **CPU涨价**:自2025年第四季度起,部分CPU大厂步入涨价周期,英特尔计划对部分处理器涨价最高达10%,AMD和英特尔计划将服务器CPU价格提高多达15% [41] * **云服务涨价**:亚马逊云科技(AWS)上调其EC2机器学习容量块价格约15%,谷歌云宣布自2026年5月1日起对部分服务进行价格调整,智谱宣布对GLMCoding Plan套餐价格整体涨幅自30%起 [41] 四、相关标的 * 报告列举的相关标的包括:东阳光、寒武纪、海光信息、网宿科技、润泽科技、协创数据、华丰科技、神州数码、大位科技、润建股份、科华数据、中芯国际、华虹半导体、中科曙光、禾盛新材、奥飞数据、优刻得、首都在线、云赛智联、瑞晟智能、浪潮信息、潍柴重机、欧陆通等 [4][44]
半导体与半导体生产设备行业周报、月报:美国或批准对中出口H200,TI12寸晶圆厂正式投产-20251222
国元证券· 2025-12-22 18:16
行业投资评级 - 推荐|维持 [5] 核心观点 - 报告标题指出,美国可能批准对华出口NVIDIA H200,德州仪器Sherman 12吋晶圆厂正式投产,这两大事件是本周行业焦点 [1] - 行业数据与重大事件显示,AI(人工智能)相关需求(如AI服务器、AI PC/NB、AI眼镜)是驱动半导体产业成长的核心动力,而先进封装(如CoWoS、ABF载板)和先进制程(如2nm、14A)是满足需求的关键环节 [3][22][29][30][31][33] - 市场指数普遍下跌,反映短期市场情绪承压,但部分细分领域(如英伟达、AMD)和个股(如英维克)表现突出,显示市场内部存在分化 [1][10][11][15][16] 市场指数表现总结 - **海外AI芯片指数**:本周上涨0.6%,扭转了上周下跌4.4%的趋势,其中英伟达上涨3.4%,AMD上涨1.3%,但博通下滑5.1% [1][10] - **国内AI芯片指数**:本周下跌4.0%,延续了上周0.6%的跌幅,成分股中仅兆易创新微涨0.2%,翱捷科技大跌14.5%,寒武纪、瑞芯微、恒玄科技跌幅超5% [1][10] - **英伟达映射指数**:本周下跌4.2%,成分股表现分化,英维克大涨15.5%,但沃尔核材跌幅超7%,工业富联、沪电股份等跌幅在4%-6% [1][11] - **服务器ODM指数**:本周下跌3.1%,成分股普跌,Wiwynn、超微电脑、鸿海精密跌幅在3%-4% [1][11] - **存储芯片指数**:本周大幅下跌4.9%,德明利、北京君正、江波龙跌幅超8%,仅兆易创新微涨 [1][15] - **功率半导体指数**:本周下跌1.2%,波动相对较小,捷捷微电和新洁能逆势上涨 [1][15] - **果链指数**:A股苹果指数本周下跌5.3%,港股苹果指数下跌3.7% [1][16] - **覆盖标的涨跌幅**:南极光(+11.20%)、深南电路(+10.65%)涨幅居前;立讯精密(-5.96%)、兆威机电(-5.65%)跌幅较大 [21] 行业数据总结 - **AI眼镜市场**:全球AI眼镜出货量预计将从2025年的500万副激增至2030年的5770万副,年复合增长率高达63%,其中具备AR显示功能的AI眼镜渗透率将从2025年的6%提升至2030年的29% [2][22] - **显示玻璃市场**:截至2025年,中国大陆已占据全球显示玻璃市场75%的份额,全球四座最大的第10.5世代线工厂均位于中国大陆,合计贡献全球25%的市场份额 [2][23] - **智能手机市场**:由于零部件成本上升影响终端需求,预计2026年全球智能手机出货量将下滑2.1% [2][28] 重大事件总结 - **先进封装与制程动态**: - 苹果因台积电CoWoS产能紧张,正评估改用英特尔的EMIB先进封装方案,可能导致其AI服务器芯片出货延迟至2028年 [3][29] - 英特尔14A先进制程已吸引NVIDIA与AMD等客户兴趣,计划用于新一代服务器处理器或加速器 [30] - ABF载板因AI服务器、AI PC/NB订单放量,层数与尺寸(放大超10倍)增加,将成为2026年产业成长主轴 [3][31] - 三星发布了全球首款采用2nm GAA制程的移动SoC芯片Exynos 2600 [33] - **地缘政治与产能布局**: - 美国政府已启动审查程序,可能批准NVIDIA H200首次出口至中国 [3][30] - 德州仪器位于美国Sherman的12吋晶圆厂已正式投产,开始向客户交付芯片,未来日产能可达数千万颗 [3][30] - 苹果正与印度芯片制造商CG Semi进行早期洽谈,拟在印度进行iPhone芯片的组装与封装 [35] - **存储市场与需求**: - 美光2026财年第一季度营收达136.4亿美元,同比增长57%,环比增长21%,公司预计DRAM供应紧张将持续到2026年以后,中期内仅能满足重要客户约50%-67%的需求 [3][33] - 由于内存供应变化及成本上升,多家PC厂商计划提价,IDC预测PC销量可能下降4.9%至8.9% [34] - **消费电子与AI应用**: - 华为折叠屏手机Pura X全系降价,以刺激市场需求 [34] - OpenAI的ChatGPT移动端全球消费额已突破30亿美元,其中2025年消费额达24.8亿美元,同比增长408% [35] - 小米宣布与徕卡战略合作升级,首款产品小米17 Ultra将于本周发布 [36] - 苹果已启动24英寸iMac OLED面板的研发工作,目标亮度为600nits [37]
研报 | 中国CSP、OEM有望积极采购H200
TrendForce集邦· 2025-12-10 17:33
美国对华AI芯片出口政策与市场影响 - 美国将允许英伟达向中国出口H200芯片 [2] - H200芯片效能较H20大幅提升 对终端客户具有吸引力 [2] - 若2026年能顺利销售 预期中国云端服务业者与OEM皆有望积极采购 [2] H200芯片产品竞争力分析 - H200算力表现与存储器规格虽不及Blackwell系列芯片 但优于H20 [2] - 中国本土AI芯片供应商或云端服务业者的自研ASIC技术发展尚面临压力 因此H200仍受青睐 [2] 2026年中国高阶AI芯片市场展望 - 观察中国整体高阶AI芯片市场发展 预估2026年总量有望成长逾60% [3] - 预计2026年本土AI芯片仍会朝向自主化发展 较具发展潜力的主要IC设计业者有机会扩大市场占比至50%左右 [3] - NVIDIA H200或AMD MI325等其他同级的海外产品 在可输入中国市场的情况下 有机会维持约近30%占比 [3]
IREN Purchases 4.2k NVIDIA Blackwell GPUs & Secures Financing - AI Cloud Expanded to 8.5k GPUs
Globenewswire· 2025-08-25 19:11
核心观点 - 公司宣布新增采购4200台NVIDIA Blackwell B200 GPU 使其GPU总量增至约8500台 同时为前期GPU采购获得1.02亿美元融资[1][3][4] 设备采购与配置 - 新增4200台NVIDIA Blackwell B200 GPU 采购金额约1.93亿美元(含配套设备)[3] - GPU总量达8500台 包括800台H100 1100台H200 5400台B200及1200台B300[4][6] - 新设备将部署于乔治王子城数据中心 该站点总电力容量为50MW 可支持阶段性扩容至约20000台Blackwell GPU[3][4][7] 融资安排 - 获得1.02亿美元融资 用于前期Blackwell B200/B300 GPU采购[1][2] - 融资采用36个月全额租赁模式 适用高个位数利率[2] - 新采购GPU的融资谈判仍在进行中 首期款项由现有现金支付[3] 运营规划 - 乔治王子城数据中心采用风冷方案 每GPU功耗1.93kW(含辅助设备) 电源使用效率PUE为1.1[7] - 总挖矿算力维持50 EH/s水平 通过高效利用其他站点闲置数据中心容量实现[3] - 公司定位为垂直整合数据中心企业 专注于比特币挖矿和AI云服务 总 secured电网电力达2910MW[10][11]
CRWV vs. MSFT: Which AI Infrastructure Stock is the Better Bet?
ZACKS· 2025-06-24 21:50
核心观点 - CoreWeave和微软均提供AI云基础设施服务 但CoreWeave专注于GPU加速的AI基础设施 而微软通过Azure平台提供更全面的AI服务 [2] - 投资者需比较两家公司在AI基础设施领域的优劣势以做出投资决策 [3] - CoreWeave展现出爆发式收入增长 但客户集中度高 微软则拥有更稳定的云业务和长期资产布局 [5][8][10] CoreWeave(CRWV)分析 - 与NVIDIA深度合作 率先部署H100/H200/GH200等GPU集群 目前拥有33个数据中心和420兆瓦电力支持 [4] - 上季度收入9.816亿美元 同比增长420% 超出预期15.2% 收购Weights and Biases新增1400家客户 [5] - 当前订单积压达259亿美元 包括与OpenAI的119亿美元合作及40亿美元的大客户扩展协议 [6] - 预计2025年资本支出将达200-230亿美元 本季度利息费用预计2.6-3亿美元 [7] - 2024年77%收入来自前两大客户 存在重大客户集中风险 [8] 微软(MSFT)分析 - Azure平台覆盖全球60多个区域 正在开发自研AI芯片Azure Maia和Cobalt [9][10] - 上季度资本支出214亿美元 其中167亿美元用于不动产和设备 315亿美元云服务订单积压 [10] - 与OpenAI独家合作 所有工作负载托管在Azure 并优先获得GPT-4 Turbo等先进模型 [12] - 推出NLWeb项目 将网站转化为AI应用 以开源方式推动Azure平台采用 [13] - 预计第四季度智能云收入287.5-290.5亿美元 Azure收入增长34-35% [14] 市场表现 - 过去一个月CoreWeave股价飙升69% 微软上涨8% [17] - 当前Zacks评级显示微软为"持有" CoreWeave为"卖出" [18]
SemiAnalysis:AMD vs NVIDIA 推理基准测试:谁赢了?--性能与每百万令牌成本分析
2025-05-25 22:09
纪要涉及的行业和公司 - **行业**:数据中心AI GPU行业 - **公司**:AMD、NVIDIA 纪要提到的核心观点和论据 性能表现 - **不同工作负载下性能差异**:对于直接拥有并运营GPU的超大规模企业和公司,某些工作负载下英伟达每美元性能更优,其他工作负载中AMD更佳;使用短期至中期租赁服务的客户,通过Neocouds平台租用显卡时,英伟达始终在每美元性能上胜出,原因是缺乏提供AMD M00X、M25X的Neocouds服务商,导致其租赁市场价格居高不下,而英伟达有数百个Neocouds提供相关显卡,租赁市场竞争激烈[6][7]。 - **各型号GPU性能对比** - **M00X**:在大多数测试场景中无法与H200竞争,但对于Lama 05B和DeepSeekv 70B,在绝对性能和每美元性能上击败H100[12]。 - **M25X**:本应是H200的竞争对手,但因发货延迟,多数客户选择B200;在部分场景如高并发下的Llama 70B和Llama 05B测试中有优势,但整体性能受发货时间影响[8][13][74][86]。 - **B200**:软件支持仍未完善,但对于当前可部署的负载和模型占据绝对优势,M25和H200性能远不及它[13]。 - **H200**:解决了H100容量短板,在多数测试中表现出色,采用TensorRT - LLM的H200性能优势明显[22][76][88]。 市场份额 - AMD在数据中心AI GPU市场份额自202年第一季度起持续增长,但2025年第一季度因英伟达推出Backwe架构产品,而AMD对标方案要到2025年第三季度面世,市场份额相应下滑,预计2025年第二季度继续下降,不过随着M55X推出和软件改进,有望在年底或明年初重新夺回部分份额[26][27]。 基准测试方法论 - **强调在线吞吐量与延迟关系**:为接近现实推理工作负载,强调分析特定配置下在线吞吐量与每位用户端到端延迟的关系,而非传统离线基准测试,通过增加并发用户数测量延迟上升,得出反映实际运营和用户体验的吞吐量指标[30][31]。 - **模型选择**:针对现实世界生产负载的密集架构和稀疏混合专家(MoE)架构模型进行测试,分别选择Lama 70B、Lama 05B和DeepSeekV 70B作为代表[45][46][47]。 - **输入/输出令牌长度**:测试三种不同输入输出令牌长度组合,分别代表摘要、翻译或对话、推理密集型任务,以全面了解模型和硬件在不同推理工作负载下的性能[49][50][51][52]。 - **推理引擎**:针对不同模型选择不同推理引擎,如Lama 70B和05B选vLLM,H200平台额外评估TensorRT - LLM;DeepSeek 70B选SGLang[54][55][59][60]。 - **并行策略**:系统性评估每种GPU架构和测试场景下所有可行的张量并行(TP)配置,测量吞吐量和延迟确定最优并行策略[61][62]。 成本分析 - **总拥有成本(TCO)**:AMD的M00X和M25X GPU通常每小时总成本低于NVDA的H100和H200 GPU,但在不同延迟和模型测试场景下,性价比表现不同[110][111]。 - **租赁成本**:在GPU租赁市场,AMD因供应有限、市场竞争不足,租赁价格被抬高,整体成本竞争力削弱,英伟达始终在每美元性能上优于AMD;为使AMD GPU在租赁市场与英伟达竞争,M00X和M25X在不同工作负载下需达到特定租赁价格[158][159][160][167][170][171]。 其他重要但可能被忽略的内容 - **生产延迟问题**:AMD的M25X发货延迟,英伟达的GB200 NVL72也因集成NVLink背板挑战和缺乏调试工具遭遇严重延误[24][25]。 - **软件支持问题**:B200和GB200软件支持不完善,如FP8 DeepSeek V在相关推理框架上无法正常运行;AMD的M55X因量产机型未上市、存在未修复缺陷未进行测试[13][172][174]。 - **基准测试阻碍**:服务框架调优参数标志多、文档不足,代码更新快,无法跨机器并行实验,AMD维护独立代码库分支和配置等问题导致基准测试耗时且困难[182][184][185][186]。 - **持续集成测试问题**:AMD的SGLang持续集成(C)测试覆盖率远不及NVDA,有数十项单元测试缺失,影响软件质量和开发者体验[188][189]。 - **模型准确性问题**:AMD在夜间准确性测试方面此前为零,25%的测试模型在AMD平台上准确性测试失败,同一模型在ROCm上运行答案不如在NVDA上智能[194][195]。