寒武纪、沐曦、摩尔线程、砺算科技、燧原科技、壁仞科技、昆仑芯、天数智芯、瀚博半导体......

行业市场格局剧变 - 英伟达在中国GPU市场的份额从巅峰时期的95%急剧跌至0%，市场出现巨大真空[1] - 2025年美国进一步收紧芯片出口管控，导致英伟达高端产品被彻底挡在中国市场之外，为国产GPU创造了前所未有的替代窗口[1] - 国产GPU企业资本化进程加速，摩尔线程科创板IPO从申报到过会仅耗时88天，沐曦股份拟募集39.04亿元投入高性能GPU研发及产业化[1] 主要参与者概览 - 中国GPU/AI芯片领域已形成多元化竞争格局，包括景嘉微、寒武纪等上市公司及沐曦、摩尔线程、壁仞科技等新兴创业公司[2] - 各公司在细分领域专注发展，如燧原科技专注于人工智能云端算力平台，天数智芯作为GPGPU云端芯片提供商，瀚博半导体注重计算机视觉及视频处理优化[2] - 海光信息在GPU相关领域有所布局，昆仑芯则依托百度生态进行发展[2] 寒武纪分析 - 采用“云边端一体、软硬件协同、训练推理融合”的技术路线，掌握智能处理器指令集、微架构等核心技术[5] - 产品线覆盖云端、边缘端和IP授权三大领域，思元220边缘智能加速卡累计销量已突破百万片，智能处理器IP产品已集成于超过1亿台智能终端设备中[5] - 打造统一的基础软件系统平台，2024年开源AI编译器前端Triton-Linalg和支持原生PyTorch的设备后端扩展插件Torch-MLU[6] - 核心对标企业为英伟达（AI加速器部分）和华为昇腾[7] 沐曦股份分析 - 聚焦全栈GPU产品研发，系统掌握GPU IP、GPU SoC、高速互连、基础软件等核心技术[9] - 产品矩阵覆盖曦思N系列（智算推理）、曦云C系列（训推一体与通用计算）和曦彩G系列（图形渲染），截至2025年3月累计销量已超过25,000颗GPU芯片[9] - MXMACA软件栈兼容CUDA生态，支持PyTorch、TensorFlow等主流AI框架，并通过开源策略推动中国版GPU编程标准的建立[10] - 核心对标企业为英伟达和AMD[11] 摩尔线程分析 - 以“全功能GPU”为核心战略，自主研发MUSA统一系统架构，集成AI计算加速、图形渲染、物理仿真和科学计算四大引擎[12] - 产品线覆盖消费级和企业级市场，旗舰产品MTT S4000搭载48GB GDDR6显存，FP32算力达25 TFLOPS，支持自研MTLink多GPU互联技术[12] - 2025年上半年AI智算产品收入占比高达94.85%，成为绝对营收支柱[12] - 推出musify代码迁移工具和torch_musa插件，积极拥抱PyTorch生态，在阿里开源Qwen3系列模型后仅用2小时就完成适配[13] 砺算科技分析 - 核心竞争力源于全栈自研的TrueGPU架构，从指令集、计算核心到软件栈均实现自主开发[15] - 采取“先图形、后计算”的发展路径，首款量产芯片G100采用6nm工艺，配备12GB GDDR6显存和48个计算单元[15] - 自研NRSS动态优化技术对标英伟达DLSS，TrueGPU架构原生融合高性能图形渲染与AI推理能力[15] - 发展轨迹与英伟达早期模式相似[16] 燧原科技分析 - 采用“训推一体”架构和“存算一体”内存架构，基于可重构计算架构设计[18] - 2025年发布的第四代L600芯片国内首创原生FP8低精度算力，拥有144GB存储容量、3.6TB/s存储带宽[18] - 第三代产品燧原S60已实现7万卡落地规模，支持300+应用场景，参与建设五大智算集群[18] - 打造“驭算”软件开发平台，2025年快速适配DeepSeek模型，体现生态兼容能力[19] - 核心对标企业为英伟达（数据中心GPU方向）[20] 壁仞科技分析 - 专注于通用GPU芯片研发，采用Chiplet异构集成技术，2022年发布的BR100芯片单芯片峰值算力达PFLOPS级别[21] - 自研BLink互连技术实现单卡互连带宽448GB/s，支持单节点8卡全互联，创新推出异构GPU协同训练方案[21] - 自主研发BIRENSUPA软件平台，推出Megatron-LM-BR训练插件，支持通义千问、DeepSeek等国产大模型零代码修改迁移[22] - 核心对标企业为英伟达（通用GPU方向）[23] 昆仑芯分析 - 前身为百度智能芯片及架构部，自主研发XPU架构，经历三代演进，昆仑芯2代采用7nm工艺，INT8峰值256 TOPS[25] - 2025年点亮国内最大3万卡单体智算集群，推出“超节点”单柜32/64卡方案，卡间带宽提升8倍[25] - 内部应用于百度搜索、推荐、文心大模型等核心业务，部署超10万片，外部客户采购占比已升至75-80%[25] - 软件栈与飞桨深度耦合，2025年在中国移动AI推理服务器集采中获三个标包70%、70%、100%份额[25] - 核心对标企业为英伟达（AI加速器部分）[26] 天数智芯分析 - 专注于自主可控的通用GPU研发，产品线覆盖云端训练芯片“天垓”系列和推理芯片“智铠”系列[27] - 天垓100是国内首款7nm云端训练通用GPU芯片，智铠100支持多精度计算，峰值算力达384TOPS@int8，性价比达市场主流产品2-3倍[27] - 天垓100累计订单近2亿元，落地超200个应用场景，定位为“云边协同、训推一体”全方案能力提供商[27] - 推出DeepSpark开源社区，自主研发IXCCL分布式通信技术，优化大模型训练效率[27] - 凭借先发量产优势在国内GPU企业竞争中占据市场[28] 瀚博半导体分析 - 基于VUCA统一计算架构，推出云端通用AI推理及视频加速卡系列产品，团队平均拥有18年以上芯片与软件设计经验[30] - 产品包括载天VA1通用AI推理加速卡、载天VA10数据中心推理卡等，专注于人工智能、融合视觉、图形渲染等领域[30] - 2023年以100亿人民币估值入选《胡润全球独角兽榜》，具备全球化研发布局[30] - 核心对标企业为AMD（综合型GPU企业）[31]