H200批准对华出口,2026年GPU还扛得住吗?

美国对华AI芯片出口政策调整 - 美国政府批准英伟达向中国出口其人工智能芯片H200,预计将重启对华出货[1] - 对华销售将由美国商务部负责审批和安全审查,美方将从相关交易中收取约25%的费用[1] - 同样的安排也将适用于其他人工智能芯片公司,如AMD和英特尔[1] - 英伟达CEO黄仁勋表示,中国是一个非常大的人工智能市场,再过两到三年,中国人工智能市场规模可能会达到500亿美元[1] 国产GPU行业迎来上市热潮与技术突破 - 2025年国产GPU公司密集上市:摩尔线程、沐曦股份成功登陆科创板,壁仞科技、天数智芯加速冲刺港股[3] - 摩尔线程上市首日股价大幅上扬468.8%,总市值迅速攀升至3055亿元[3] - 沐曦股份上市首日收盘涨幅高达692.95%[3] - 2025年全球GPU市场规模预计突破3500亿美元,中国占比接近40%[4] - 国产GPU企业取得技术突破:摩尔线程基于MUSA架构推出“花港”架构,算力密度提升50%,效能提升10倍[4];壁仞科技推出性能对标英伟达A100/H100的BR100芯片[4];天数智芯成为国内首家实现7nm GPGPU量产的企业[4] - 商业化层面,国产GPU已切入政务云、智算中心等核心场景[4] 国产GPU面临的生态与系统级挑战 - 国产GPU的突破仍停留在“单点技术达标”层面,尚未形成“全栈生态闭环”的核心竞争力[5] - 与英伟达相比,在高速互连协议、大规模集群调度等关键环节存在明显短板[5] - 英伟达的CUDA生态覆盖了90%以上的AI框架,形成了短期难以撼动的壁垒[5] - 国产GPU厂商各自为战的指令集与软件栈,导致开发者适配成本高昂[5] ASIC芯片对GPU市场的冲击与替代趋势 - 云服务厂商越来越偏爱自研ASIC芯片[8] - 集邦咨询预测,2026年云服务厂商对自研ASIC的需求增速将大幅领先GPU,其中ASIC增长率预计达44.6%,远超GPU的16.1%[9] - 谷歌推出第7代TPU芯片Ironwood,训练和推理性能比第六代TPU提升4倍[9] - 谷歌计划在2026年将TPU芯片产能提升至430万颗,其中新一代V8系列合计占比达65%[9] - 亚马逊推出首款3nm AI芯片Trainium 3,计算能力较Trainium 2大幅提升[10] - Meta与Broadcom共同开发下一代MTIA v2,微软下一代Maia v2的设计也已定案[10] - 国内云服务企业也推出自研ASIC芯片,如阿里巴巴的含光800、百度的昆仑芯、腾讯的紫霄芯片等[10] - 野村证券报告称,目前英伟达GPU在AI服务器市场中占据超过80%的份额,而ASIC仅占约8%-11%[11] - 野村证券预测,到2025年,仅谷歌和亚马逊两家的ASIC出货量就可能达到英伟达GPU出货量的40%至60%[11] - 高盛预测ASIC服务器将在2025至2026年间占据全球AI服务器市场38%至40%的份额[12] 存算一体技术对GPU构成的新挑战 - 存算一体技术旨在解决传统计算架构中数据搬运导致的“冯·诺依曼瓶颈”[13] - 在处理大模型推理时,数据搬运产生的能耗可能占到近50%[15] - 存算一体技术能将数据搬运产生的损耗降低60%以上,在低功耗场景下优势明显[15] - 该技术产业化逻辑是从GPU不擅长的场景突破,与GPU形成“互补竞争”[15] - 自2017年起,英伟达、微软、三星等大厂提出了存算一体原型,同年国内存算一体芯片企业开始涌现[15] - 国内初创企业如知存科技、亿铸科技、九天睿芯等押注不同的存算一体技术路线,分别专注于大算力场景和边缘小算力场景[16] GPU的固有优势与巨头的反击策略 - GPU在大模型训练、复杂科学计算等需要多任务并行处理的场景里,通用性和灵活性是ASIC、存算一体短期内比不了的[18] - 2025年12月24日,英伟达以200亿美元收购推理芯片独角兽Groq的核心技术与团队[19] - Groq的LPU芯片以5-10倍于GPU的速度优势,以及1/10的成本优势,切中了英伟达在推理赛道的核心短板[19] - 此次收购延续了英伟达通过并购补全生态、巩固优势的一贯策略[20] - 未来在大模型训练等通用算力场景,GPU仍将保持核心优势;而在推理、边缘计算等细分领域,其与ASIC、存算一体芯片的“互补共存”将成为主流[20]