寒武纪思元系列芯片
搜索文档
国产算力崛起:内外双轮驱动下的自主生态突围
国投证券· 2026-03-04 18:43
行业投资评级 - 领先大市-A [6] 核心观点 - 内外需求共振,开启国产算力历史窗口 海外云厂商资本开支进入新一轮上行周期,牵引全球设备需求,为中国云计算投资提供周期性机遇 美国对华芯片管制不断升级,倒逼国内形成以“自主可控”为核心的政策与产业共识 中国自上而下全面布局,构建覆盖战略规划、基础设施与场景开放的完整政策体系 以DeepSeek-V2为代表的轻量化模型技术突破,大幅降低训练与推理算力负担,为国产芯片切入主流AI应用扫清关键性能门槛 [1] - 自主技术突破,夯实国产算力供给底座 硬件层面,国内通过Chiplet(芯粒)技术路径实现“制程混搭”,兼顾性能、良率与成本,支撑高端AI芯片规模化落地 国产AI芯片(如华为昇腾、寒武纪、海光信息)在GPGPU与ASIC双架构路线上持续迭代,单卡算力、内存带宽及能效比快速提升,并通过自研互联技术构建高效集群能力 软件生态通过兼容层适配、自主软件栈研发和开源开放模式三路并行破局 系统集成层面,“超节点”技术通过硬件重构、统一内存池及智能调度,实现算力效率与能源利用率的数量级提升 [2] - 国产算力生态价值兑现,迎接战略机遇 在外部压力与内生需求双轮驱动下,国产算力产业已从单点突破迈入以“自主技术体系、全栈生态能力、商业闭环验证”为特征的新阶段 产业链上下游协同效应日益凸显,国产算力正从“可用”加速转变为“好用”的主流方案 展望2026年,伴随国内云厂商资本开支进入上行通道、轻量化模型广泛应用以及国产算力生态持续成熟,国产算力基础设施有望在政务、金融、互联网及智能制造等关键行业实现规模化部署与价值兑现 [3] 行业需求与周期分析 - 海外云厂商资本开支呈“四年周期”,2026年AI芯片出货量有望维持高增长 北美云巨头资本开支在过去十年呈现“算力代际—IDC扩建—设备折旧”三重叠加周期,周期长度稳定在3–4年 2018年北美云厂商CapEx同比增长60%,2022年提升20%+,2024年迅速回升至55.1% 在此算力迭代周期牵引下,2026年仍有望维持AI芯片与相关算力设备的高出货节奏,为中国云计算投资带来阶段性共振机会 [11][12] - 国内云厂商投资周期与海外非同步,但预计2025–2026年将进入新一轮上行周期 过去两年,中国互联网大厂因外部环境制约和行业处于从传统云向AI云的结构性迁移期,投资节奏被迫扰动,周期性弱、结构性更强 从2025年开始,国内周期将逐步与海外重新同步 综合海外周期上行、国内对AI算力的迫切需求以及国产算力生态快速完善的背景,预计2025年起国内云厂商资本开支将迎来明显抬升,并在2026年延续高增态势 [15][16][17] 外部政策环境与国产算力崛起 - 美国对华芯片管制不断升级,形成全链条封锁,倒逼国产算力体系加速发展 自2018年以来,美国对华半导体与人工智能领域的出口管制从硬件封锁逐步扩展到设备、软件工具、云算力乃至AI模型训练行为本身 政策演进呈现“以收紧为主、以局部松动为辅”的波动式演进,2025年出现“有限放松”与“严格锁死”并存的新格局 外部压力促使中国在自主算力芯片、AI模型框架、国产EDA、先进封装等多个方向加速突破 [18][19][33] - 外部压力下,供应链可控性与成本可持续性成为企业核心诉求,政策与产业扶持加速本土替代 美国持续高频次、不确定性的限制,使依赖海外GPU和云算力成为重大风险,企业决策转向“供货稳定+成本可控+系统可预期” 美国的限制强化了国内政策的响应力度,国家层面加大对国产GPU、互联架构、AI框架及整机算力系统的投入 随着大厂将算力任务迁移到国产平台,国产算力生态进入“需求拉动—能力提升”的正循环,迭代速度加快 [34] 国内政策体系与产业布局 - 国家层面构建多层次、全链条的政策驱动体系,系统化推进国产算力发展 第一层级为国家战略引领,通过“东数西算”等国家级工程优化全国资源布局 第二层级为部委细则推进,制定具体行业路线图与时间表 第三层级为地方精准落地,形成因地制宜的产业集群与应用场景 第四层级为产业链协同攻坚,龙头企业牵头组建生态联盟,突破兼容性、稳定性与易用性瓶颈 [37] - “东数西算”工程为核心国家级专项,截至2024年6月底,八大枢纽节点直接投资超435亿元,机架总规模超195万架 [40] - 地方政策因地制宜,东部地区侧重构建生态与引领应用,中西部地区依托成本优势承接算力需求转移 例如,北京市计划到2025年全市智算供给规模达45 EFLOPS,发放“算力券”给予最高20%、单个企业最高3000万元的补贴 上海市计划到2027年智算规模达200EFLOPS,自主可控算力占比超70%,发放总额达10亿元的“算力券、模型券、语料券” 安徽省通过国家、省、市三级政策叠加,对企业智能算力使用的综合补贴最高可达75% [43][45][47] 轻量化模型技术突破与算力需求迁移 - 以DeepSeek-V2为代表的国产轻量化模型技术取得突破,为国产算力硬件创造历史性机遇 DeepSeek-V2通过稀疏混合专家架构(MoE)、高压缩注意力机制(MLA)及全栈工程协同等创新,在保持高性能的同时大幅降低算力需求 其总参数量2360亿,但每令牌仅激活约210亿参数,训练成本较同类密集模型降低42.5%,推理吞吐量提升至基线模型的5.76倍 [57][60][64] - 轻量化模型技术对国产训练与推理芯片产生差异化赋能 对训练芯片:将进入大模型训练赛道的初始算力门槛从“数万卡·月”级别显著下降,使国产芯片获得准入门票 训练任务评价标准更侧重集群通信效率、内存带宽利用率与软硬件协同优化,有利于国产算力体系围绕自主技术生态进行闭环创新 [65][68][69] 对推理芯片:将市场核心诉求从“单卡峰值算力”转向“性价比”与“能效比”,进入国产芯片的优势区 国产推理芯片能够与国产轻量化模型及框架进行深度协同优化,构建极具竞争力的总拥有成本壁垒 [74][75] - AI算力需求正从训练侧向推理侧迁移,构成国产算力崛起的历史性窗口 全球AI推理市场规模预计在2028年将达1500亿美元,年复合增长率超40%,远高于训练市场 预计中国人工智能服务器工作负载中推理占比将从2024年的65%提升至2028年的73% [76][77] 硬件与核心技术突破 - 在先进制程受限背景下,Chiplet(芯粒)技术成为破局关键,实现“制程混搭”与“化整为零” Chiplet技术将计算核心与I/O等模块解耦,有效扬长避短,兼顾了性能、良率与成本,支撑了高端AI芯片的规模化落地 [2] - 国产AI芯片在GPGPU与ASIC双架构路线上持续迭代,并构建高效集群能力 国产AI芯片如华为昇腾、寒武纪、海光信息等,单卡算力、内存带宽及能效比快速提升 通过MetaXLink、MLU-Link等自研互联技术构建了从千卡到万卡级的高效集群能力 [2] 软件生态与系统集成突破 - 软件生态破局三路并行:兼容适配、自主研发与开源开放 通过兼容层快速适配现有CUDA生态以降低迁移门槛 坚持研发自主软件栈以释放硬件潜力 以开源开放模式构建长期独立的生态体系 [2] - 系统集成层面,“超节点”技术实现算力效率与能源利用率的数量级提升 以华为CloudMatrix、昆仑芯超节点为代表的“超节点”技术,通过硬件重构、统一内存池及智能调度,为千亿参数大模型训练与高并发推理提供坚实的系统级底座 [2] 投资建议关注公司 - 报告建议关注包括寒武纪、海光信息、壁仞科技、沐曦股份、摩尔线程、华为(昇腾)、昆仑芯等在内的国产算力产业链公司 [7]
解读:特朗普突批H200入华,抽成25%背后的大棋局
未可知人工智能研究院· 2025-12-09 18:01
美国对华AI芯片出口政策转向 - 2025年12月8日,美国总统特朗普宣布批准英伟达向中国出口H200人工智能芯片,但要求从每笔销售中抽取25%的分成[1] - 此举与一周前美国国会讨论全面禁止对华出口高端AI芯片的《SAFE法案》形成180度大转弯[1] - 政策转向源于12月2日英伟达CEO黄仁勋与特朗普政府的闭门会谈,旨在挽救英伟达在中国市场的颓势[4] 政策方案的具体设计 - 选择性放行:仅开放技术代差约为18个月的H200芯片,而非最新的Blackwell或即将发布的Rubin芯片[4] - 高额抽成:英伟达需将H200对华销售额的25%上缴美国政府,且此模式将推广至AMD、英特尔等其他AI芯片企业[5] - 条件限制:反复强调出口前提是“保障美国国家安全”,并保留随时收回许可的权力[5] 政策背后的商业算计 - 美国政府预计每季度可从价值20亿至50亿美元的芯片出口中,按保守估计获利5亿美元,全年达20亿美元,被视为“无本万利”的生意[6] - 对英伟达而言,虽然利润被压缩,但相比因出口禁令导致在华销售额几乎停滞、并减记约55亿美元相关费用的局面,恢复部分市场准入仍具吸引力[4][7] - 该政策被解读为一种“利益捆绑机制”,使英伟达与美国政府成为利益共同体,以确保出口政策的持续性[7] 中国AI芯片产业的崛起态势 - 根据Bernstein Research报告,到2026年,华为将占据中国AI芯片市场50%的份额,而英伟达的份额将从目前的39%大幅萎缩至仅8%[13] - 2025年,华为AI芯片市场份额已冲至40%,与英伟达并列第一;预计2026年华为占50%,AMD占12%,寒武纪占9%[15] - 未来三年,中国本土AI芯片销售额的复合年增长率预计高达74%,到2028年本土产量将超过国内需求,供需比达104%[16] 本土厂商的技术进展与产能规划 - 华为昇腾系列持续迭代,并公布了未来三年的产品路线图[16] - 寒武纪构建了完整的云边端产品矩阵,并宣布2026年将把AI加速器产量提升逾两倍至50万枚[16] - 百度昆仑芯新一代产品在性能和成本上实现大幅改善[17] - 海光在GPU通用计算领域持续发力,逐步打破英伟达在某些场景的垄断[18] 中国市场对美政策的冷静反应 - 中国市场对H200芯片的态度并不热情,主因在于美国政策反复无常导致信任破裂,企业更看重算力供应的稳定性[31][32] - H200需承担25%额外成本,其综合性价比可能与采购多张国产芯片相当,而国产芯片的成长空间更大[33] - 政策导向鼓励优先采购国产算力,且中国企业已在国产芯片生态上投入大量研发资源,转换成本高[36][37] - 安全隐患(如“后门”或远程“断供”风险)以及中兴事件的教训,使得中国企业在选择核心技术供应商时格外谨慎[34][35] 政策逻辑的悖论与战略影响 - 以25%分成来化解所谓的“国家安全”威胁,暴露了该政策本质是商业利益问题而非安全问题[20] - 与拜登政府“一刀切”封锁不同,特朗普政府的“收保护费”式放行是试图通过“技术代差+高额抽成”维持市场影响力和科技霸权[22][23] - 外部封锁反而成为中国技术突破的催化剂,加速了中国的技术自主化进程和全球半导体供应链的“去美国化”趋势[24][25][40] 全球产业格局与多方博弈结果 - 英伟达并未真正获胜:长期市场份额面临灾难性下滑(从39%至8%),利润空间被压缩,且无法摆脱政治风险[38] - 美国政府也未获胜:短期获利无法弥补长期战略失误,其政策加速了全球对美技术依赖的警惕和各国的自主半导体计划[39][40] - 对中国而言,进口H200可短期缓解算力短缺,但若因此放松自主研发则将陷入“技术依赖陷阱”;真正的胜利在于实现自主技术创新[42][43][44]
甲骨文大象起舞,带飞国产算力!芯原股份收购芯来,强化ASIC竞争力!科创人工智能ETF(589520)盘中涨近3%
新浪基金· 2025-09-12 10:07
国产AI产业链表现 - 科创人工智能ETF(589520)9月12日盘中价格涨近3% 收盘涨1.81% 实现日线三连阳[1] - 成份股芯原股份涨超15% 寒武纪涨逾4% 优刻得涨超3% 云从科技、虹软科技、金山办公等跟涨[1] - ETF单位净值0.619元 较前日上涨0.011元 成交额1646.99万份 换手率3.13%[2] 全球算力投资加速 - 微软计划2026财年资本开支超300亿美元 谷歌与Meta分别将2025年Capex上调至850亿和660亿美元以上[3] - 全球科技巨头加码AI基础设施 推高对高端芯片、服务器、光模块、存储等核心硬件需求[3] - 中国日均Token处理量从2024年初1000亿飙升至2025年6月30万亿 一年半增长超300倍[4] 国产替代政策支持 - 国务院明确到2027年实现AI与六大重点领域深度融合[4] - 工信部推动"人工智能+制造"专项行动 杭州等地设立亿元级算力券支持本土智算中心建设[4] - 华为CloudMatrix384超节点验证国产超大规模集群商用能力 阿里云倚天710、寒武纪思元系列芯片持续迭代[4] 市场前景与需求 - IDC预测2025年中国智能算力规模达1037.3 EFLOPS 2024–2028年复合增长率46.2%[4] - 国产算力芯片在AI训练、推理中取得良好效果 政策支持推动大规模部署应用[5] - 科创人工智能ETF于9月5日完成1:2基金份额拆分 交易门槛由120元降至60元[5] 指数产品特征 - 科创人工智能指数前十大重仓股权重占比71.66% 半导体行业权重占比54.1%[7] - ETF具备20%涨跌幅限制 前十大重仓股权重超七成 集中度高进攻性强[7] - 成份股聚焦国产AI产业链细分环节收入最大或卡位最好的公司[6]
英伟达H20受限中国市场,国产AI芯片替代多点开花方为正解
钛媒体APP· 2025-04-20 08:52
美国政府升级对英伟达H20芯片的出口管制 - 美国政府于4月9日通知英伟达,H20芯片出口到中国需要许可证,并于14日宣布规定将无限期实施[2] - H20被纳入"非民用超算风险清单",标志着AI芯片管制从高端产品延伸至定制化中端产品[2] - H20是英伟达在中国合法销售的主要芯片,于2023年10月美国最新出口限制生效后推出[2] 美国对AMD和英特尔AI芯片的出口限制 - 美国商务部宣布AMD MI308及同类型AI芯片新增中国出口许可要求[6] - 英特尔Gaudi芯片同样需要获得出口许可证才能向中国销售[6] 国内AI芯片厂商的替代机会 - 华泰证券指出H20销售受限或已被市场预期,但新规可能堵住以内存弥补算力漏洞[6] - 万联证券认为H20在中国市场的销售或将面临较大限制,国内AI芯片厂商有望承接更多市场份额[6] - 国产算力迎来发展机遇,全球贸易摩擦或加速半导体产业国产化进程[6] 华为昇腾910C的性能与优势 - 昇腾910C通过组合两个昇腾910B芯片,计算能力达800 TFLOP/s(FP16),内存带宽3.2 TB/s,接近英伟达H100性能的80%[7] - 华为通过CloudMatrix系统聚合算力,CM384系统在规模及推理性能上比肩英伟达NVL72超节点[7] - 昇腾910C采用共封装或芯片组技术,显著提升性能[7] 华为昇腾910C的技术挑战 - 组合设计导致功耗增加,CM384系统功耗为英伟达GB200 NVL72的3.9倍[9][10] - 每FLOP功耗差2.3倍,每TB/s内存带宽功耗差1.8倍,每TB HBM内存容量功耗差1.1倍[10] - die-to-die带宽仅为Nvidia H100的1/10至1/20,可能影响大规模AI训练任务效率[11] 华为昇腾910C的生态系统与供应链问题 - 华为MindSpore AI框架成熟度和广泛采用度较低,可能限制开发者采用[11] - 昇腾910C良率仅为32%-40%,低于60%的行业标准,大部分仍依赖台积电7nm工艺制造[12] - 关键组件如HBM主要来自韩国供应商三星,供应链模式稳定性差、风险高[13] 国内其他AI芯片厂商的布局 - 科技大厂阿里、百度、腾讯、商汤科技等布局自研AI芯片,服务于自有云平台或业务[14] - 海光信息DCU系列产品兼容CUDA生态,已应用于国产超算和AI训练场景[15] - 寒武纪思元系列芯片可满足云端训练等场景需求,壁仞科技BR100芯片峰值算力达国际厂商旗舰产品3倍以上[15][16] 国内AI芯片多元化发展的重要性 - 中国AI芯片替代不能仅靠个别企业,需支持华为、海光信息、摩尔线程等多元化发展[17] - 构建强大、完整、有韧性的全产业链自主生态是实现AI芯片自主可控的关键[17]