Workflow
寒武纪、沐曦、摩尔线程、砺算科技、燧原科技、壁仞科技、昆仑芯、天数智芯、瀚博半导体......
是说芯语·2025-10-25 16:17

行业市场格局剧变 - 英伟达在中国GPU市场的份额从巅峰时期的95%急剧跌至0%,市场出现巨大真空[1] - 2025年美国进一步收紧芯片出口管控,导致英伟达高端产品被彻底挡在中国市场之外,为国产GPU创造了前所未有的替代窗口[1] - 国产GPU企业资本化进程加速,摩尔线程科创板IPO从申报到过会仅耗时88天,沐曦股份拟募集39.04亿元投入高性能GPU研发及产业化[1] 主要参与者概览 - 中国GPU/AI芯片领域已形成多元化竞争格局,包括景嘉微、寒武纪等上市公司及沐曦、摩尔线程、壁仞科技等新兴创业公司[2] - 各公司在细分领域专注发展,如燧原科技专注于人工智能云端算力平台,天数智芯作为GPGPU云端芯片提供商,瀚博半导体注重计算机视觉及视频处理优化[2] - 海光信息在GPU相关领域有所布局,昆仑芯则依托百度生态进行发展[2] 寒武纪分析 - 采用“云边端一体、软硬件协同、训练推理融合”的技术路线,掌握智能处理器指令集、微架构等核心技术[5] - 产品线覆盖云端、边缘端和IP授权三大领域,思元220边缘智能加速卡累计销量已突破百万片,智能处理器IP产品已集成于超过1亿台智能终端设备中[5] - 打造统一的基础软件系统平台,2024年开源AI编译器前端Triton-Linalg和支持原生PyTorch的设备后端扩展插件Torch-MLU[6] - 核心对标企业为英伟达(AI加速器部分)和华为昇腾[7] 沐曦股份分析 - 聚焦全栈GPU产品研发,系统掌握GPU IP、GPU SoC、高速互连、基础软件等核心技术[9] - 产品矩阵覆盖曦思N系列(智算推理)、曦云C系列(训推一体与通用计算)和曦彩G系列(图形渲染),截至2025年3月累计销量已超过25,000颗GPU芯片[9] - MXMACA软件栈兼容CUDA生态,支持PyTorch、TensorFlow等主流AI框架,并通过开源策略推动中国版GPU编程标准的建立[10] - 核心对标企业为英伟达和AMD[11] 摩尔线程分析 - 以“全功能GPU”为核心战略,自主研发MUSA统一系统架构,集成AI计算加速、图形渲染、物理仿真和科学计算四大引擎[12] - 产品线覆盖消费级和企业级市场,旗舰产品MTT S4000搭载48GB GDDR6显存,FP32算力达25 TFLOPS,支持自研MTLink多GPU互联技术[12] - 2025年上半年AI智算产品收入占比高达94.85%,成为绝对营收支柱[12] - 推出musify代码迁移工具和torch_musa插件,积极拥抱PyTorch生态,在阿里开源Qwen3系列模型后仅用2小时就完成适配[13] 砺算科技分析 - 核心竞争力源于全栈自研的TrueGPU架构,从指令集、计算核心到软件栈均实现自主开发[15] - 采取“先图形、后计算”的发展路径,首款量产芯片G100采用6nm工艺,配备12GB GDDR6显存和48个计算单元[15] - 自研NRSS动态优化技术对标英伟达DLSS,TrueGPU架构原生融合高性能图形渲染与AI推理能力[15] - 发展轨迹与英伟达早期模式相似[16] 燧原科技分析 - 采用“训推一体”架构和“存算一体”内存架构,基于可重构计算架构设计[18] - 2025年发布的第四代L600芯片国内首创原生FP8低精度算力,拥有144GB存储容量、3.6TB/s存储带宽[18] - 第三代产品燧原S60已实现7万卡落地规模,支持300+应用场景,参与建设五大智算集群[18] - 打造“驭算”软件开发平台,2025年快速适配DeepSeek模型,体现生态兼容能力[19] - 核心对标企业为英伟达(数据中心GPU方向)[20] 壁仞科技分析 - 专注于通用GPU芯片研发,采用Chiplet异构集成技术,2022年发布的BR100芯片单芯片峰值算力达PFLOPS级别[21] - 自研BLink互连技术实现单卡互连带宽448GB/s,支持单节点8卡全互联,创新推出异构GPU协同训练方案[21] - 自主研发BIRENSUPA软件平台,推出Megatron-LM-BR训练插件,支持通义千问、DeepSeek等国产大模型零代码修改迁移[22] - 核心对标企业为英伟达(通用GPU方向)[23] 昆仑芯分析 - 前身为百度智能芯片及架构部,自主研发XPU架构,经历三代演进,昆仑芯2代采用7nm工艺,INT8峰值256 TOPS[25] - 2025年点亮国内最大3万卡单体智算集群,推出“超节点”单柜32/64卡方案,卡间带宽提升8倍[25] - 内部应用于百度搜索、推荐、文心大模型等核心业务,部署超10万片,外部客户采购占比已升至75-80%[25] - 软件栈与飞桨深度耦合,2025年在中国移动AI推理服务器集采中获三个标包70%、70%、100%份额[25] - 核心对标企业为英伟达(AI加速器部分)[26] 天数智芯分析 - 专注于自主可控的通用GPU研发,产品线覆盖云端训练芯片“天垓”系列和推理芯片“智铠”系列[27] - 天垓100是国内首款7nm云端训练通用GPU芯片,智铠100支持多精度计算,峰值算力达384TOPS@int8,性价比达市场主流产品2-3倍[27] - 天垓100累计订单近2亿元,落地超200个应用场景,定位为“云边协同、训推一体”全方案能力提供商[27] - 推出DeepSpark开源社区,自主研发IXCCL分布式通信技术,优化大模型训练效率[27] - 凭借先发量产优势在国内GPU企业竞争中占据市场[28] 瀚博半导体分析 - 基于VUCA统一计算架构,推出云端通用AI推理及视频加速卡系列产品,团队平均拥有18年以上芯片与软件设计经验[30] - 产品包括载天VA1通用AI推理加速卡、载天VA10数据中心推理卡等,专注于人工智能、融合视觉、图形渲染等领域[30] - 2023年以100亿人民币估值入选《胡润全球独角兽榜》,具备全球化研发布局[30] - 核心对标企业为AMD(综合型GPU企业)[31]