是说芯语
搜索文档
主流国产AI算力芯片全景图
是说芯语· 2025-09-23 15:42
文章核心观点 - 人工智能算力芯片是国家人工智能战略的核心基础设施,国内AI芯片产业在国产化替代政策引导下蓬勃发展,形成多元化竞争格局,主要厂商分为三类:专攻训练与推理的ASIC厂商、主打CPU路线的厂商以及布局全栈解决方案的厂商 [1] - GPU占据AI芯片市场主导地位,2025年GPU将占AI芯片80%市场份额,通用型算力GPU因架构优化(缩减图形渲染功能)具有更优计算能效比,广泛应用于人工智能模型训练和推理领域 [1] - 国产AI芯片在性能、生态和供应链自主化方面持续突破,通过多精度计算支持、先进封装技术(如Chiplet)、软件生态兼容(如类CUDA平台)和集群级解决方案与国际厂商竞争,并深入行业应用场景 [37] AI芯片分类与技术特性 - AI芯片按部署位置分为云端芯片(承担训练和高带宽推理任务)和边缘/终端芯片(承担独立推理任务);按功能分为训练芯片和推理芯片 [3] - 主流AI芯片包括GPU、FPGA和ASIC(如VPU/TPU):GPU通用性强且适合大规模并行运算,但图形渲染功能在推理端无法发挥算力;FPGA可编程配置架构适应算法迭代,开发时间短(6个月),但量产单价高且峰值算力低;ASIC通过算法固化实现极致性能和能效,量产后成本最低,但研发时间长(1年)且技术风险大 [2] - 评价AI芯片性能的核心指标为算力(单位TOPS/TFLOPS)、功耗(性能功耗比)和面积(影响成本及良率),其中算力类型包括INT8、FP32等精度 [4][5] 国际厂商技术对比(英伟达) - 英伟达GPGPU采用微架构(Volta/Ampere/Hopper)、CUDA核、Tensor核、显存容量和带宽等硬件参数决定性能,代表产品V100/A100/A800/H100在算力、显存和互联技术上持续迭代 [6] - 具体性能对比:H100(Hopper架构)FP32算力51 TFLOPS、INT8算力1513 TOPS、显存带宽2TB/s,较A100(Ampere架构)FP32算力19.5 TFLOPS、INT8算力624 TOPS、显存带宽1935 GB/s显著提升;互联技术从NVLink 300 GB/s(V100)升级至NVLink 600 GB/s(H100) [6] 国产AI芯片厂商全景 - 国内厂商分为三类:ASIC路线(寒武纪、天数智芯、昆仑芯)、GPGPU路线(海光信息、壁仞科技、沐曦集成电路)和全栈解决方案路线(昇腾、平头哥、摩尔线程、燧原科技) [1][34] - 代表性上市公司:寒武纪(市值493亿元)、海光信息(市值1336亿元)、景嘉微(市值367亿元);非上市公司如沐曦(Pre-B轮融资10亿元)、天数智芯(C++轮融资超10亿元)通过多轮融资支持产品研发 [8] - 国产芯片制程以7nm为主(如寒武纪MLU370、海光DCU、天数智芯Big Island),部分采用12nm(平头哥含光800、燧原云燧i20),5nm技术处于研发中 [9][11][23][28] 厂商产品与技术特点 - 寒武纪:云边端产品矩阵(MLU370系列、Cambricon终端处理器),采用自主指令集架构(Cambricon ISA)支持动态可重构和低精度量化,算力达256 TOPS(INT8),制程7nm [10][11][12] - 海光信息:产品线包括CPU和DCU协处理器(深算系列),采用GPGPU架构兼容类CUDA环境,支持多精度计算和高带宽内存,深算一号显存带宽1024 GB/s(对比英伟达A100 2039 GB/s) [14][15][17] - 沐曦集成电路:聚焦高性能GPGPU,支持全线精度计算(FP32/FP16/BF16/INT8),注重软件生态兼容和能效优化 [18][19][20] - 壁仞科技:首款GPGPU芯片BR100采用Chiplet技术,FP16算力超1000T、INT8算力超2000T,擅长大模型训练 [22] - 燧原科技:训练推理全栈方案(云炬系列),云燧i20采用12nm工艺实现256 TOPS算力,单位面积效率媲美7nm GPU [23] - 平头哥:端云一体解决方案(含光800采用12nm工艺,算力820 TOPS),与阿里云生态协同 [28] - 昇腾:全栈生态系统(芯片+硬件+软件+应用),昇腾910B支持FP32/FP16精度,单卡性能对标英伟达A800/A100 [29] - 摩尔线程:基于MUSA架构覆盖AI计算与图形渲染,MTT S4000提供INT8算力200 TOPS、显存带宽768 GB/s,兼容X86/ARM和CUDA生态 [30][31][32] 性能与生态建设 - 国产芯片算力在INT8精度下普遍达100-200 TOPS(如燧原i20 256 TOPS、昆仑芯R200迭代升级),部分厂商支持FP64多精度计算和HBM高带宽内存 [9][23][25][37] - 软件生态通过兼容主流框架(PyTorch/TensorFlow)、构建类CUDA平台(海光DTK、沐曦MXMACA)及深度集成(昆仑芯与百度飞桨)降低开发门槛 [15][25][37] - 集群级解决方案成为竞争焦点,如华为昇腾超节点、壁仞科技光互连GPU超节点支持万卡级集群 [37] 应用场景与行业渗透 - 芯片应用覆盖互联网、安防、金融、政务、能源、科研等领域,具体场景包括智能数据分析、模型训练、边缘计算和自动驾驶(如地平线征程5用于自动驾驶) [2][12][16][25] - 厂商通过适配主流大模型(DeepSeek/LLaMA/ChatGLM)和行业定制化解决方案(如寒武纪用于推荐系统、海光用于商业计算)实现深度软硬协同 [12][16][37]
市场必然会低估“英伟达投资1000亿美元给OpenAI”的深刻影响…
是说芯语· 2025-09-23 09:26
以下文章来源于橙子不糊涂 ,作者橙子 的根本理解,老黄无愧教父。 3,对于我们国内产业链来说, 未来一段时间,会获得超出预期的订单和净利润率 ,估值会继续 扩张。但目前很多朋友第一反应就是"理性带点亢奋"的利好… 也就是说,很多人看到今天这样的情况,觉得大利好,但是认识依然停留在一次性事件上,"利 好兑现"是主流。 4, 首选Rubin受益的,就是技术有迭代,而且会继续迭代的 ,比如机柜结构(代工)、比如 PCB。 AI一直在超越我们的想象,完全是一种全新的科技、产业、资本以及国与国的竟合形态。已经不 是星辰大海了,从"1000亿美金"这个规模来看,已经开始冲到外太空了…而且未来真的能在AI这 个桌上放开吃饭的,真的只有中美。 橙子不糊涂 . 88年,集成电路背景,主要写科技,偶尔聊聊宏观和新鲜事儿。 英伟达投资1000亿美元给OpenAI,有4个观点角度: 1,英伟达在反击强势的谷歌。从投资50亿美金给Intel,再到凌晨的1000亿给OpenAI,老黄短短 几天两次出手,都非常惊艳。一句话, 不要低估英伟达和老黄… 2,之前讨论过的下一阶段AI infrastructure的一个大的叙事就是: 通过融资/ ...
腾讯不会自研GPU芯片 但会大力支持国产
是说芯语· 2025-09-23 07:32
公司战略定位 - 腾讯明确表示当前及未来均无生产人工智能芯片的计划 与国内其他科技企业形成显著反差 [1] - 公司采取全栈优化策略 通过整合不同类型芯片资源构建具备成本优势的AI算力支撑体系 [1] - 已实现国产芯片全面适配 通过算法改进和计算集群优化最大化利用现有算力资源 [1] 业务区域布局 - 对中国市场与海外业务进行战略性区分 国内业务场景中国产芯片使用比例显著提升 [3] - 海外市场由当地合作伙伴提供芯片硬件支持 公司聚焦输出软件技术与专业解决方案 [3] - 腾讯云国际业务过去三年保持两位数增长 投资1.5亿美元在沙特建设中东首个数据中心 [3] - 在日本大阪建设第三个数据中心 完善全球算力网络布局 [3] 行业竞争动态 - 华为成功研发Ascend系列处理器 已被生成式AI初创企业DeepSeek采用 [6] - 百度旗下昆仑芯公司将自研昆仑P800芯片应用于ERNIE大模型训练与测试环节 [6] - 阿里巴巴推出新型AI芯片 性能较前代明显提升 旨在填补英伟达芯片受限后的市场空白 [6]
华为的算力突围
是说芯语· 2025-09-23 07:32
华为全联接大会2025核心发布 - 华为官宣未来三年多款芯片及超节点演进路线 包括昇腾950构建的全球最强超节点 以及2027年四季度上市的昇腾960超节点 [5] - 鲲鹏950和鲲鹏960处理器将在通算领域超节点部署 [5] - 华为云CloudMatrix超节点规格将从384卡升级至8192卡 支持50~100万卡超大集群 AI算力实现重大突破 [5][7] 算力基础设施创新 - CloudMatrix384超节点采用架构创新 将资源池化为算力池、内存池、显存池 实现计算与存储任务解耦 推理性能大幅提升 [7] - 基于MatrixLink高速互联与多网合一技术 构建50~100万卡集群 单卡推理性能达中国特供版GPU H20的3~4倍 [7][8] - 华为云AI算力规模较去年增长268% 昇腾AI云客户从321家增至1805家 覆盖央国企、智驾、大模型等多行业 [25] 行业解决方案落地 - 盘古大模型在政务、金融、制造等30多个行业落地 覆盖500多个场景 云南交投案例中问答准确率提升20% 车流预测精度提升10% [12] - 华为云为万华化学实现2000多台设备预测性维护 模型准确率从70%提至90% 异常识别效率提升10% 人工巡检时间下降20% [24] - 在长安汽车研发效率提升30% 订单交付周期从21天缩短至15天 [25] 智能体平台与企业应用 - Versatile企业级智能体平台覆盖Agent开发、运营、运维全生命周期 开发效率提升3倍 数据迭代周期从周缩短至天 [13][15] - 华为云慧通差旅智能体"通宝"实现路径规划采用率超50% 差旅预订时间缩短至2分钟 [15] - 企业级智能体解决业务流程复杂、低幻觉容忍度、高运行要求等挑战 [13] 全球化服务能力 - 华为云覆盖34个地理区域、101个可用区 构建国内30ms、海外50ms时延的"全球一张网" [20] - 土耳其品牌Defacto实现659天0事故运行 页面加载时间从1.5秒缩至260毫秒 [20][21] - 巴西Neogrid公司数据集成效率提升40% 数据分析效率提升50% [21] 技术生态与行业地位 - 华为云在容器、数据库等9个领域入围Gartner魔力象限 17个解决方案位居领导者象限 获30余项细分领域第一 [25] - 政务、工业、金融、汽车四大行业市场份额第一 跻身医疗、药物、气象、汽车领导者象限 [25] - 为360纳米AI提供3000万Token处理能力 突破AI内存墙限制 [10]
怕了吗!?美国军方禁止购买中国OLED技术
是说芯语· 2025-09-22 12:10
法案核心内容 - 美国众议院通过一项修正案 禁止美国军方购买由中国或俄罗斯国有企业生产的数字显示技术 [1] - 该修正案是美国《国防授权法案》的一部分 法案以231票赞成对196票反对的结果获得众议院批准 [2] - 修正案将禁止五角大楼从美国对手政府支持的公司购买OLED显示屏 [2] 法案提出的背景与目的 - 提出修正案的议员表示 依赖来自敌对来源的技术构成国家安全风险 [2] - 这些技术是关键军事装备的支柱 从驾驶舱显示器到士兵佩戴的系统 对对手来源的依赖对美国的国家安全和技术主权构成明显威胁 [2] - 修正案旨在确保美国不会依赖中国 俄罗斯等其他外国对手的显示器 [2] 法案后续流程与技术说明 - 包括该修正案在内的美国军方拨款措施仍需经参议院批准 [3] - 修正案的范围比之前的版本更广泛 之前的版本要求五角大楼审查是否应将几家中国公司添加到中国军事公司名单中 [3] - OLED显示屏即有机发光二极管显示器 具备超薄 广视角 高对比度 快速响应等优势 广泛应用于智能手机 电视 智能手表 VR设备等领域 [3]
突发!十倍业绩芯片股,董事长被留置!
是说芯语· 2025-09-22 08:45
9月21日晚,臻镭科技披露《关于公司重大事项的公告》称, 公司实际控制人、董事长郁发新被黄石市 监察委员会实施留置措施,暂不能履行董事相关职责。 臻镭科技 表示,公司将继续按照《公司法》《科创板股票上市规则》等相关法律法规和相关制度规范 运作,日常经营管理由公司高级管理人员负责,公司已对相关工作进行了妥善安排。公司拥有完善的治 理结构及内部控制机制,公司董事会运作正常, 董事长无法履职期间由董事张兵代为履行公司董事长 的相关职责,其他董事、高级管理人员均正常履职 ,公司及子公司各项生产经营情况正常,资金账户 正常。该事项不会对公司正常经营产生重大影响。 根据公告,截至该公告披露日, 臻镭科技 未收到相关机关对公司的任何调查或者配合调查文件,也未 知悉留置调查的进展及结论。 臻镭科技称, 公司将持续关注上述事项的后续情况,并及时履行信息披 露义务、提示相关风险。 敬请广大投资者理性投资,注意投资风险。 上半年净利润增超十倍 资料显示,臻镭科技专注于集成电路芯片和微系统的研发、生产和销售,并围绕相关产品提供技术服 务。公司主要产品包括射频收发芯片及高速高精度ADC/DAC芯片、电源管理芯片、微系统及模组等, 为客 ...
刚刚,沐曦集成电路IPO回复第二轮问询
是说芯语· 2025-09-22 08:40
202 5 年9 月21 日, 上 交所官网显示,沐曦集成电路 (上海)股份有限公司(简称: 沐曦集成电路/ 沐曦 股份 ) 科创板 IPO第二轮审核问询回复已挂 网。 此前, 沐曦集成电路 IPO于2025年6月30日受理,2025年7月19 日收到首轮问询,2025年9月5日收到第二轮问询。 沐曦集成电路IPO 保荐机构为 华泰联合证券有限责任公司,审计机构为立信会计师事务所(特殊普通合伙),律师 事务所为上海市锦天城律师事务所。 以下为招股书及问询摘录 主营业务情况 发行人致力于自主研发全栈高性能 GPU芯片及计算平台,主营业务是研发、设计和销售应用于人工智能训练和推 理、通用计算与图形渲染领域的全栈GPU产品,并围绕GPU芯片提供配套的软件栈与计算平台。自成立以来,发 行人始终专注于GPU产品的技术创新和迭代升级,形成了独具优势的GPU产品体系和自主开放的软件生态,持续 为云端计算提供高能效、高通用性的算力支撑,推动人工智能赋能千行百业,重点布局了教科研、金融、交通、 能源、医疗健康、大文娱等行业应用场景,已成为推动我国智能算力基础设施自主可控的重要力量。 作为国内高 性能GPU产品的主要领军企业之一 ...
中微公司宣布又一项目开工!
是说芯语· 2025-09-21 17:36
公司战略布局 - 中微半导体在广州市增城经济技术开发区开工华南总部研发及生产基地项目 聚焦大平板显示设备领域 并拓展至智能玻璃和板级封装等新兴平板微观加工技术领域 [1][2] - 华南总部基地总体规划占地130亩 一期项目占地50亩 预计2026年底建成 2027年投产 [2] - 公司计划通过有机生长和外延扩展 在未来五到十年将半导体高端设备覆盖率从25%-30%提升至50%-60% 发展成为平台型集团公司 [2] 市场与区域发展 - 广州市增城区通过引进中微等骨干项目 布局全省首个智能传感器产业园和全市唯一高端电子信息新材料产业园 培育智能传感器晶圆制造领域错位发展优势 [3] - 增城区积极服务广东"强芯工程" 助力广州打造国家集成电路产业发展"第三极"核心承载区 [3] - 华南基地建设使公司更贴近市场 快速响应客户需求 增强在半导体及泛半导体产业链的战略布局 [2] 技术领域拓展 - 公司现有三十多种设备已覆盖半导体高端设备的25%至30% [2] - 新基地将聚焦大平板显示设备 并拓展智能玻璃和板级封装等新兴平板微观加工技术领域 [2] - 项目将极大丰富公司产品线 提升在全球高端半导体设备领域的领先地位 [2]
致手握1700万存款的鹅厂失业焦虑者
是说芯语· 2025-09-21 17:33
最近, 看到一位腾讯老弟发帖,37岁,失业,存款1700万,却说自己"很焦虑"。 但他的处境却是 "能掌控的很多,只是暂时没确定想要什么"。这种 "有钱、有经验、有时间试错" 的状态,更像是 "手里握着一副好牌,只是在想 怎么打更顺"—— 哪怕暂时没出第一张,也不用怕输,反而有底气慢慢琢磨。所以真换成我,可能会先给自己放两周假,彻底从之前的工作节奏里 抽离,再慢慢列一张 "想尝试的清单",从 "最小成本的试错" 开始 —— 毕竟有 1700 万打底,哪怕走点弯路,也有底气绕回来。 平台曾托举,错认是己能,风口逐浪去,方知身是萍。 存款非枷锁,应是渡舟人,何必拘身份,空耗岁华深。 剧场主角退,小馆亦能吟,活给本心看,清风自满襟。 加入"中国IC独角兽联盟",请点击进入 你有很多种选择,还焦虑个毛线! 就此写一首打油诗送给你! 曾踏鹅厂云,身携百万薪,胸间藏傲气,履历镀金鳞。 一朝风停驻,前路顿生尘,千万银钱在,偏锁眉间颦。 怕失旧时位,怕丢昨日尊,低阶不肯就,高岗觅无门。 焦虑往往源于 "想要的太多,能掌控的太少"。 是说芯语原创,欢迎关注分享 ...
三星重大突破! 暴露 HBM4 供应体系的野心!
是说芯语· 2025-09-21 15:25
在全球高端存储芯片竞争白热化的当下,韩国科技巨头三星电子迎来了里程碑式的突破。 据韩国媒体最新报道,三星凭借其 12 层堆叠的 HBM3E 产品,成功通过 NVIDIA 的严格认证,正式跻 身这位 "绿队" 巨头的 HBM 供应链体系。 加入"中国IC独角兽联盟",请点击进入 是说芯语转载,欢迎关注分享 星标 是说芯语 不错过任何一条消息 ▶ 早在冲击 NVIDIA HBM 供应链初期,三星的 HBM3 产品便因散热问题遭遇滑铁卢,后续调查证实,这 一缺陷根源在于其 DRAM(动态随机存取存储器)技术的设计漏洞。为扭转局面,三星曾转向 8 层 HBM3E 方案寻求突破,然而该方案沿用老旧的 1a 代第四代 DRAM 技术,导致性能不足与散热隐患并 存,最终仍未获得 NVIDIA 的认可。连续的技术挫折,让三星在 HBM 这一高附加值赛道上一度陷入被 动,甚至面临 "技术尊严" 的挑战 —— 毕竟在全球 AI 算力需求爆发的背景下,HBM 作为 AI 服务器的 核心组件,已成为衡量存储厂商技术实力的关键标尺。 据行业消息源 KED Global 披露,为攻克技术难关,三星对 DRAM 芯片设计进行了大幅优化,从 ...