Workflow
是说芯语
icon
搜索文档
主流国产AI算力芯片全景图
是说芯语· 2025-09-23 15:42
文章核心观点 - 人工智能算力芯片是国家人工智能战略的核心基础设施,国内AI芯片产业在国产化替代政策引导下蓬勃发展,形成多元化竞争格局,主要厂商分为三类:专攻训练与推理的ASIC厂商、主打CPU路线的厂商以及布局全栈解决方案的厂商 [1] - GPU占据AI芯片市场主导地位,2025年GPU将占AI芯片80%市场份额,通用型算力GPU因架构优化(缩减图形渲染功能)具有更优计算能效比,广泛应用于人工智能模型训练和推理领域 [1] - 国产AI芯片在性能、生态和供应链自主化方面持续突破,通过多精度计算支持、先进封装技术(如Chiplet)、软件生态兼容(如类CUDA平台)和集群级解决方案与国际厂商竞争,并深入行业应用场景 [37] AI芯片分类与技术特性 - AI芯片按部署位置分为云端芯片(承担训练和高带宽推理任务)和边缘/终端芯片(承担独立推理任务);按功能分为训练芯片和推理芯片 [3] - 主流AI芯片包括GPU、FPGA和ASIC(如VPU/TPU):GPU通用性强且适合大规模并行运算,但图形渲染功能在推理端无法发挥算力;FPGA可编程配置架构适应算法迭代,开发时间短(6个月),但量产单价高且峰值算力低;ASIC通过算法固化实现极致性能和能效,量产后成本最低,但研发时间长(1年)且技术风险大 [2] - 评价AI芯片性能的核心指标为算力(单位TOPS/TFLOPS)、功耗(性能功耗比)和面积(影响成本及良率),其中算力类型包括INT8、FP32等精度 [4][5] 国际厂商技术对比(英伟达) - 英伟达GPGPU采用微架构(Volta/Ampere/Hopper)、CUDA核、Tensor核、显存容量和带宽等硬件参数决定性能,代表产品V100/A100/A800/H100在算力、显存和互联技术上持续迭代 [6] - 具体性能对比:H100(Hopper架构)FP32算力51 TFLOPS、INT8算力1513 TOPS、显存带宽2TB/s,较A100(Ampere架构)FP32算力19.5 TFLOPS、INT8算力624 TOPS、显存带宽1935 GB/s显著提升;互联技术从NVLink 300 GB/s(V100)升级至NVLink 600 GB/s(H100) [6] 国产AI芯片厂商全景 - 国内厂商分为三类:ASIC路线(寒武纪、天数智芯、昆仑芯)、GPGPU路线(海光信息、壁仞科技、沐曦集成电路)和全栈解决方案路线(昇腾、平头哥、摩尔线程、燧原科技) [1][34] - 代表性上市公司:寒武纪(市值493亿元)、海光信息(市值1336亿元)、景嘉微(市值367亿元);非上市公司如沐曦(Pre-B轮融资10亿元)、天数智芯(C++轮融资超10亿元)通过多轮融资支持产品研发 [8] - 国产芯片制程以7nm为主(如寒武纪MLU370、海光DCU、天数智芯Big Island),部分采用12nm(平头哥含光800、燧原云燧i20),5nm技术处于研发中 [9][11][23][28] 厂商产品与技术特点 - 寒武纪:云边端产品矩阵(MLU370系列、Cambricon终端处理器),采用自主指令集架构(Cambricon ISA)支持动态可重构和低精度量化,算力达256 TOPS(INT8),制程7nm [10][11][12] - 海光信息:产品线包括CPU和DCU协处理器(深算系列),采用GPGPU架构兼容类CUDA环境,支持多精度计算和高带宽内存,深算一号显存带宽1024 GB/s(对比英伟达A100 2039 GB/s) [14][15][17] - 沐曦集成电路:聚焦高性能GPGPU,支持全线精度计算(FP32/FP16/BF16/INT8),注重软件生态兼容和能效优化 [18][19][20] - 壁仞科技:首款GPGPU芯片BR100采用Chiplet技术,FP16算力超1000T、INT8算力超2000T,擅长大模型训练 [22] - 燧原科技:训练推理全栈方案(云炬系列),云燧i20采用12nm工艺实现256 TOPS算力,单位面积效率媲美7nm GPU [23] - 平头哥:端云一体解决方案(含光800采用12nm工艺,算力820 TOPS),与阿里云生态协同 [28] - 昇腾:全栈生态系统(芯片+硬件+软件+应用),昇腾910B支持FP32/FP16精度,单卡性能对标英伟达A800/A100 [29] - 摩尔线程:基于MUSA架构覆盖AI计算与图形渲染,MTT S4000提供INT8算力200 TOPS、显存带宽768 GB/s,兼容X86/ARM和CUDA生态 [30][31][32] 性能与生态建设 - 国产芯片算力在INT8精度下普遍达100-200 TOPS(如燧原i20 256 TOPS、昆仑芯R200迭代升级),部分厂商支持FP64多精度计算和HBM高带宽内存 [9][23][25][37] - 软件生态通过兼容主流框架(PyTorch/TensorFlow)、构建类CUDA平台(海光DTK、沐曦MXMACA)及深度集成(昆仑芯与百度飞桨)降低开发门槛 [15][25][37] - 集群级解决方案成为竞争焦点,如华为昇腾超节点、壁仞科技光互连GPU超节点支持万卡级集群 [37] 应用场景与行业渗透 - 芯片应用覆盖互联网、安防、金融、政务、能源、科研等领域,具体场景包括智能数据分析、模型训练、边缘计算和自动驾驶(如地平线征程5用于自动驾驶) [2][12][16][25] - 厂商通过适配主流大模型(DeepSeek/LLaMA/ChatGLM)和行业定制化解决方案(如寒武纪用于推荐系统、海光用于商业计算)实现深度软硬协同 [12][16][37]
市场必然会低估“英伟达投资1000亿美元给OpenAI”的深刻影响…
是说芯语· 2025-09-23 09:26
文章核心观点 - 英伟达近期进行大规模战略投资 包括向英特尔投资50亿美元以及向OpenAI投资1000亿美元 旨在巩固其行业领导地位并加速AI基础设施的扩张[5] - AI基础设施投资正进入一个规模急剧扩大、速度加快的阶段 涉及吉瓦级项目和数百亿至上千亿美元的投资 英伟达通过投资客户来放大自身收益并绑定增长[5] - 对于中国国内硬件产业链而言 该事件预计将带来超出预期的订单和净利润率 并推动估值继续扩张[6] - 在技术迭代中 英伟达下一代Rubin架构的受益方向 如机柜结构和PCB等领域 是值得关注的投资选择[6] - AI产业的发展已超越传统想象 成为一种全新的科技、产业和资本形态 未来全球AI竞争格局将主要由中美两国主导[6] 英伟达的战略举措与行业影响 - 英伟达在短时间内连续进行重大投资 包括向英特尔投资50亿美元和向OpenAI投资1000亿美元 展现出强烈的市场竞争意图[5] - 公司通过投资其客户来购买自身产品 能够将收益规模放大4至5倍 并借助AI的指数增长曲线与客户深度绑定[5] - 这些举措被视为对谷歌等竞争对手挑战的有力回应 巩固了英伟达在AI领域的核心地位[5] AI基础设施的发展趋势 - AI基础设施下一阶段的核心叙事是通过融资或债务进行快速规模扩张 未来将出现众多吉瓦级别的项目以及数百亿甚至上千亿美元级别的投资[5] - 此阶段的投资速度和规模将显著加快和扩大 吸引更多公司乃至寻求“主权AI”的国家参与其中[5] - 行业投资热潮将持续 直到市场“看腻了”为止[5] 对中国产业链的预期影响 - 英伟达的大规模投资预计将为中国国内硬件产业链带来超出市场预期的订单量和净利润率[6] - 产业链相关公司的估值有望在此背景下继续扩张[6] - 尽管市场普遍认为是利好 但许多投资者的认识仍停留在“一次性事件”层面 认为“利好兑现”是主流观点[6] 具体技术受益方向 - 在英伟达下一代Rubin架构的迭代中 技术持续升级的领域将优先受益 例如机柜结构(代工)和PCB(印制电路板)[6]
腾讯不会自研GPU芯片 但会大力支持国产
是说芯语· 2025-09-23 07:32
公司战略定位 - 腾讯明确表示当前及未来均无生产人工智能芯片的计划 与国内其他科技企业形成显著反差 [1] - 公司采取全栈优化策略 通过整合不同类型芯片资源构建具备成本优势的AI算力支撑体系 [1] - 已实现国产芯片全面适配 通过算法改进和计算集群优化最大化利用现有算力资源 [1] 业务区域布局 - 对中国市场与海外业务进行战略性区分 国内业务场景中国产芯片使用比例显著提升 [3] - 海外市场由当地合作伙伴提供芯片硬件支持 公司聚焦输出软件技术与专业解决方案 [3] - 腾讯云国际业务过去三年保持两位数增长 投资1.5亿美元在沙特建设中东首个数据中心 [3] - 在日本大阪建设第三个数据中心 完善全球算力网络布局 [3] 行业竞争动态 - 华为成功研发Ascend系列处理器 已被生成式AI初创企业DeepSeek采用 [6] - 百度旗下昆仑芯公司将自研昆仑P800芯片应用于ERNIE大模型训练与测试环节 [6] - 阿里巴巴推出新型AI芯片 性能较前代明显提升 旨在填补英伟达芯片受限后的市场空白 [6]
华为的算力突围
是说芯语· 2025-09-23 07:32
华为全联接大会2025核心发布 - 华为官宣未来三年多款芯片及超节点演进路线 包括昇腾950构建的全球最强超节点 以及2027年四季度上市的昇腾960超节点 [5] - 鲲鹏950和鲲鹏960处理器将在通算领域超节点部署 [5] - 华为云CloudMatrix超节点规格将从384卡升级至8192卡 支持50~100万卡超大集群 AI算力实现重大突破 [5][7] 算力基础设施创新 - CloudMatrix384超节点采用架构创新 将资源池化为算力池、内存池、显存池 实现计算与存储任务解耦 推理性能大幅提升 [7] - 基于MatrixLink高速互联与多网合一技术 构建50~100万卡集群 单卡推理性能达中国特供版GPU H20的3~4倍 [7][8] - 华为云AI算力规模较去年增长268% 昇腾AI云客户从321家增至1805家 覆盖央国企、智驾、大模型等多行业 [25] 行业解决方案落地 - 盘古大模型在政务、金融、制造等30多个行业落地 覆盖500多个场景 云南交投案例中问答准确率提升20% 车流预测精度提升10% [12] - 华为云为万华化学实现2000多台设备预测性维护 模型准确率从70%提至90% 异常识别效率提升10% 人工巡检时间下降20% [24] - 在长安汽车研发效率提升30% 订单交付周期从21天缩短至15天 [25] 智能体平台与企业应用 - Versatile企业级智能体平台覆盖Agent开发、运营、运维全生命周期 开发效率提升3倍 数据迭代周期从周缩短至天 [13][15] - 华为云慧通差旅智能体"通宝"实现路径规划采用率超50% 差旅预订时间缩短至2分钟 [15] - 企业级智能体解决业务流程复杂、低幻觉容忍度、高运行要求等挑战 [13] 全球化服务能力 - 华为云覆盖34个地理区域、101个可用区 构建国内30ms、海外50ms时延的"全球一张网" [20] - 土耳其品牌Defacto实现659天0事故运行 页面加载时间从1.5秒缩至260毫秒 [20][21] - 巴西Neogrid公司数据集成效率提升40% 数据分析效率提升50% [21] 技术生态与行业地位 - 华为云在容器、数据库等9个领域入围Gartner魔力象限 17个解决方案位居领导者象限 获30余项细分领域第一 [25] - 政务、工业、金融、汽车四大行业市场份额第一 跻身医疗、药物、气象、汽车领导者象限 [25] - 为360纳米AI提供3000万Token处理能力 突破AI内存墙限制 [10]
怕了吗!?美国军方禁止购买中国OLED技术
是说芯语· 2025-09-22 12:10
法案核心内容 - 美国众议院通过一项修正案 禁止美国军方购买由中国或俄罗斯国有企业生产的数字显示技术 [1] - 该修正案是美国《国防授权法案》的一部分 法案以231票赞成对196票反对的结果获得众议院批准 [2] - 修正案将禁止五角大楼从美国对手政府支持的公司购买OLED显示屏 [2] 法案提出的背景与目的 - 提出修正案的议员表示 依赖来自敌对来源的技术构成国家安全风险 [2] - 这些技术是关键军事装备的支柱 从驾驶舱显示器到士兵佩戴的系统 对对手来源的依赖对美国的国家安全和技术主权构成明显威胁 [2] - 修正案旨在确保美国不会依赖中国 俄罗斯等其他外国对手的显示器 [2] 法案后续流程与技术说明 - 包括该修正案在内的美国军方拨款措施仍需经参议院批准 [3] - 修正案的范围比之前的版本更广泛 之前的版本要求五角大楼审查是否应将几家中国公司添加到中国军事公司名单中 [3] - OLED显示屏即有机发光二极管显示器 具备超薄 广视角 高对比度 快速响应等优势 广泛应用于智能手机 电视 智能手表 VR设备等领域 [3]
突发!十倍业绩芯片股,董事长被留置!
是说芯语· 2025-09-22 08:45
公司重大事项 - 公司实际控制人、董事长郁发新被实施留置措施,暂不能履行董事职责[1][4] - 公司控制权未发生变化,日常经营管理由高级管理人员负责,董事长职责由董事张兵代为履行[4] - 公司未收到相关机关的任何调查文件,未知悉调查进展及结论[4] 公司经营与财务状况 - 公司上半年实现营业收入2.05亿元,同比增长73.64%[6] - 公司上半年归母净利润6231.97万元,同比增长1006.99%[6] - 公司拥有完善治理结构,董事会运作正常,生产经营和资金账户正常[4] 股东股权变动 - 股东杭州晨芯投资等三家一致行动人拟转让830.52万股股份,占总股本3.88%[6] - 询价转让最终价格为53.52元/股,转让股份获全额认购,17家机构投资者获配[7] - 权益变动后,郁发新及其一致行动人持股比例从32.62%减少至28.74%,套现约4.44亿元[7] 公司业务与市场表现 - 公司专注于集成电路芯片和微系统研发生产,产品应用于特种及民用领域[6] - 截至9月19日收盘,公司股价报69.5元/股,今年以来累计涨幅达98.57%[3]
刚刚,沐曦集成电路IPO回复第二轮问询
是说芯语· 2025-09-22 08:40
IPO审核进展 - 公司科创板IPO于2025年6月30日获受理,2025年9月21日披露第二轮审核问询回复 [1] - 首轮问询于2025年7月19日收到,第二轮问询于2025年9月5日收到 [1] - IPO保荐机构为华泰联合证券,审计机构为立信会计师事务所,律师事务所为上海市锦天城律师事务所 [1] 公司业务与产品 - 公司主营业务为自主研发全栈高性能GPU芯片及计算平台,产品应用于人工智能训练和推理、通用计算与图形渲染领域 [6] - 已推出用于智算推理的曦思N系列GPU、用于训推一体和通用计算的曦云C系列GPU,并正在研发用于图形渲染的曦彩G系列GPU [8] - 产品基于自主研发的GPU IP与统一架构,在通用性、单卡性能、集群性能及稳定性等方面具备核心竞争力 [8] - 截至报告期末,公司GPU产品累计销量超过25,000颗 [9] 技术实力与行业地位 - 公司是国内少数系统掌握先进制程GPU芯片及基础系统软件研发、设计和量产技术的企业之一 [7] - 深度积累了GPU IP、GPU SoC、高速互连、GPU软件等核心技术,成功突破高性能GPU技术瓶颈 [7] - 截至2025年3月31日,公司拥有境内授权专利255项,其中发明专利245项 [10] - 公司被认定为国家级专精特新“小巨人”企业、国家高新技术企业等,并获得多项行业荣誉奖项 [10] 市场生态与客户 - 公司深度构建“1+6+X”生态与商业布局,交付9大智算集群,算力网络覆盖国家人工智能公共算力平台、运营商智算平台和商业化智算中心 [9] - 产品已布局教科研、金融、交通、能源、医疗健康、大文娱等行业应用场景 [9] - 根据未审数据,公司2025年1-6月销售收入约9亿元,截至2025年8月15日在手订单金额11.40亿元 [13] 审核问询关注要点 - 交易所关注经销商模式是否实质构成代销,以及客户源庐加佳的交易合理性及可持续性 [13][14] - 关注应收账款回收风险,例如截至2025年3月末对超讯通信的应收账款余额为16,105.73万元,截至2025年7月末回款比例仅为10.78% [15] - 问询存货订单覆盖率问题,训推一体系列存货在手订单覆盖率从2023年末的98.73%下降至2025年3月末的59.46% [15] - 关注研发人员数量变动,公司研发人员从2024年末的706人减少至2025年3月末的652人 [18]
中微公司宣布又一项目开工!
是说芯语· 2025-09-21 17:36
公司战略布局 - 中微半导体在广州市增城经济技术开发区开工华南总部研发及生产基地项目 聚焦大平板显示设备领域 并拓展至智能玻璃和板级封装等新兴平板微观加工技术领域 [1][2] - 华南总部基地总体规划占地130亩 一期项目占地50亩 预计2026年底建成 2027年投产 [2] - 公司计划通过有机生长和外延扩展 在未来五到十年将半导体高端设备覆盖率从25%-30%提升至50%-60% 发展成为平台型集团公司 [2] 市场与区域发展 - 广州市增城区通过引进中微等骨干项目 布局全省首个智能传感器产业园和全市唯一高端电子信息新材料产业园 培育智能传感器晶圆制造领域错位发展优势 [3] - 增城区积极服务广东"强芯工程" 助力广州打造国家集成电路产业发展"第三极"核心承载区 [3] - 华南基地建设使公司更贴近市场 快速响应客户需求 增强在半导体及泛半导体产业链的战略布局 [2] 技术领域拓展 - 公司现有三十多种设备已覆盖半导体高端设备的25%至30% [2] - 新基地将聚焦大平板显示设备 并拓展智能玻璃和板级封装等新兴平板微观加工技术领域 [2] - 项目将极大丰富公司产品线 提升在全球高端半导体设备领域的领先地位 [2]
致手握1700万存款的鹅厂失业焦虑者
是说芯语· 2025-09-21 17:33
文章核心观点 - 文章通过一个具体案例,探讨了资深专业人士在职业转型期的心理状态与策略选择,核心观点在于拥有雄厚资本(1700万人民币存款)和丰富经验(如前腾讯员工)的个体,不应因离开原有高位平台而焦虑,而应视其为探索新机遇的底气,将财务储备转化为支持试错的“渡舟”,鼓励其打破对过往身份和职级的执着,以更灵活和开放的心态开启职业生涯新阶段 [1] 人物背景与现状 - 人物曾任职于腾讯(“鹅厂”),拥有光鲜的履历和背景 [1] - 人物目前处于职业间歇期,拥有1700万人民币的存款储备 [1] - 人物当前状态被描述为“有钱、有经验、有时间试错”,但面临“前路顿生尘”的迷茫与选择焦虑 [1] 心理分析与批判 - 指出其焦虑部分源于对失去过往职位与尊重的担忧(“怕失旧时位,怕丢昨日尊”) [1] - 批判了一种常见的认知误区:将在成功平台(如腾讯)上取得的成就,错误地完全归因于自身能力(“平台曾托举,错认是己能”) [1] - 强调在行业风口过去后,个体可能意识到自身的波动性与依赖性(“风口逐浪去,方知身是萍”) [1] 建议的行动策略 - 建议首先进行彻底的心理脱离,例如给自己放两周假,从既往工作节奏中抽离 [1] - 建议采取“最小成本试错”策略,列出一张“想尝试的清单”并开始探索 [1] - 强调1700万的财务基础提供了强大的安全垫和容错空间,足以支持其“绕回”正轨 [1] - 鼓励放下对职级和身份的执着(“低阶不肯就”、“何必拘身份”),以更务实和开放的态度寻找机会 [1] - 倡导心态转变,从追求成为“剧场主角”到接受在“小馆”中也能施展才华,活出本心 [1]
三星重大突破! 暴露 HBM4 供应体系的野心!
是说芯语· 2025-09-21 15:25
三星电子HBM技术突破与市场进展 - 三星电子凭借其12层堆叠的HBM3E产品,成功通过NVIDIA的严格认证,正式进入NVIDIA的HBM供应链体系[1] 技术挑战与应对措施 - 三星早期HBM3产品因散热问题遭遇失败,根源在于其DRAM技术的设计漏洞[3] - 三星后续的8层HBM3E方案因沿用老旧的1a代第四代DRAM技术,导致性能不足与散热隐患,仍未获NVIDIA认可[3] - 为攻克难关,三星对DRAM芯片设计进行了大幅优化,从核心架构层面解决了散热与性能瓶颈[3] - 公司对HBM业务板块追加了高额重资产投入,涵盖生产线升级、研发团队扩充等关键环节[3] 当前市场格局与未来战略 - 目前NVIDIA的HBM供应主要依赖SK海力士与美光,三星初期能获得的12层HBM3E订单规模相对有限[4] - 三星将此次突破视为“跳板”,核心目标已瞄准下一代HBM4技术[4] - 依托最新的1c代DRAM技术并结合自家4nm逻辑芯片工艺,三星已成功研发出数据传输速率达11Gbps的HBM4产品,成为全球首个实现这一指标的厂商[4] - 三星计划将HBM4供应体系扩展至AMD、博通、谷歌等科技巨头,以打开新的增长空间[4]