国产GPU
搜索文档
摩尔线程完成上市辅导,国产 GPU 第一股呼之欲出
是说芯语· 2025-06-19 14:37
公司IPO进展 - 摩尔线程IPO辅导状态变更为"辅导验收",距离登陆资本市场更近一步[1] - 若成功上市将成为国内真正意义上的GPU第一股[1] - 公司成立于2020年,已完成6轮融资累计超45亿元,投资方包括红杉中国、腾讯、字节跳动等40多家机构[1] 产品与技术实力 - 自主研发GPU芯片采用MUSA架构,集成AI计算加速、图形渲染、视频编解码、物理仿真和科学计算四大引擎[2] - 2023年12月落地全国产千卡千亿模型训练平台摩尔线程KUAE夸娥智算中心[2] - 2024年3月MTT S4000计算卡与DeepSeek-R1671B大模型通过中国信通院评测验证[2] 资本市场反应 - 参股公司和而泰当日股价涨幅近7%,带动相关概念股上涨[2] - 市场预期上市后将扩大产能、加大研发投入,提升市场份额[2] - 分析师认为其市值表现值得期待,代表国产算力芯片行业阶段性成果[2] 行业竞争格局 - AI算力需求爆发式增长,信创政策推动国产替代加速[3] - 竞争对手包括寒武纪、壁仞科技等企业[3] - 与国际巨头英伟达相比在技术成熟度和市场份额仍有较大差距[3] 上市挑战 - 股东结构复杂,股东穿透核查工作量巨大[3] - 需在竞争中实现盈利是上市后的重要挑战[3] 行业意义 - 完成上市辅导是国产GPU行业发展的重要里程碑[3] - 对国产算力芯片产业具有深远意义[3]
昇腾910系列全年出货量下调
是说芯语· 2025-06-12 08:38
国产GPU采购情况 - 字节跳动对国产GPU态度最为积极,主要采用寒武纪和昇腾,并广泛测试昆仑芯、天数、沐曦、摩尔等其他品牌,2025年计划追加购买昇腾和寒武纪卡,同时采购海光卡 [2] - 阿里巴巴对国产GPU态度较为谨慎,上线部分昇腾卡但性能表现不佳,2025年预计首次采购海光和寒武纪卡,同时继续加大英伟达产品储备,自研芯片平头哥尚未商业化推广 [2][3] - 腾讯对国产GPU态度最保守,首选英伟达,其次为华为产品,最后考虑寒武纪和海光,2025年资本支出计划包括400亿用于GPU采购,110亿用于高性能服务器采购 [2][3] 昇腾910系列出货及性能 - 昇腾910B累计出货量达16万张,主要客户为地方超算中心和运营商,910C因量产延迟仅出货2.7万张,预计后续单月出货量增至5万张,主要客户为大型互联网公司如字节跳动 [5][6] - 昇腾910C单卡性能在国产芯片中领先,但集群能力仍逊于NVIDIA产品,全年出货目标从85万张下调至70万张,其中910B和910C各占一半 [5][6] - 昇腾卡应用场景中15%-20%用于模型训练,其余用于推理,训练场景面临成本高和技术难题限制,仅DeepSeek、科大讯飞等少数头部企业尝试使用 [6] 行业技术趋势与竞争 - FP8成为推理侧硬件基本要求,多模态模型推动更高标准硬件需求,如CloudMatrix 384超节点方案,国产芯片厂商正加紧追赶国际领先品牌 [7] - NVIDIA即将推出适配中国市场的新一代算力卡,推理场景下仍有竞争力,寒武纪、海光等国产品牌在生态系统建设上取得进展 [7] - 互联网大厂与昇腾合作定制化开发需投入大量人力资源适配,相比直接使用NVIDIA卡增加时间成本和技术难度 [8] 市场动态与需求变化 - 互联网巨头采购策略波动较大,受训练卡缺口大、推理卡需求小及910C出货延迟影响,字节跳动占据昇腾910C近三分之一需求份额 [6] - 一体机市场热度下降导致出货量低于预期,阿里平头哥自研芯片逐步替代也对昇腾市场需求产生影响 [6]
昇腾910系列全年出货量下调
傅里叶的猫· 2025-06-11 19:31
国产GPU行业动态 - 美国对GPU的限制政策促使国产GPU快速发展 华为昇腾系列性能被英伟达CEO提及已超越H200 但表述存在夸张成分[1] - 互联网巨头资本开支计划显示国产GPU采购趋势:字节跳动2025年计划投入1600亿 阿里未来3年投入3800亿 腾讯2025年投入900亿用于云和AI基础设施[2] 国内大厂采购策略 - 字节跳动最积极采用国产GPU 主要采购寒武纪和昇腾 并广泛测试其他国内品牌 2025年计划增加采购量[2] - 阿里巴巴态度谨慎 除自研平头哥外上线部分昇腾卡 但性能表现不佳 2025年计划首次采购海光和寒武纪卡 同时继续储备英伟达产品[2] - 腾讯最保守 首选英伟达 其次考虑华为产品 最后评估寒武纪和海光 已认证摩尔线程 2025年资本支出包含大规模GPU采购和算力租赁[2] 昇腾910系列出货与性能 - 昇腾910B累计出货达16万张 保持稳定 而910C因量产延迟仅出货2.7万张 预计后续单月出货将提升至5万张[3] - 910C在国产芯片中集群能力领先 单卡性能获市场认可 但服务端支持和生态系统建设仍是短板[3] - 全年出货目标从85万张下调至70万张 其中910B和910C各占一半 调整主因包括互联网巨头需求波动及阿里自研芯片替代影响[6] 应用场景与市场需求 - 昇腾卡15%-20%用于模型训练 其余主要用于推理 但训练场景面临高成本和技术难题 仅DeepSeek、科大讯飞等头部企业尝试使用[6] - 910B主要客户为地方超算中心和运营商 910C则更多被大型互联网公司采用 字节跳动占其需求近三分之一[6] - 一体机产品因市场热度下降 出货量预计低于预期[6] 技术发展趋势 - FP8成为推理侧硬件基本要求 多模态模型推动更高标准需求 CloudMatrix 384超节点方案逐渐成为行业标杆[7] - 国产芯片厂商在生态系统建设上取得进展 寒武纪、海光等品牌已解决部分兼容性问题 长期有望扩大市场份额[7][8] - 互联网大厂与昇腾合作定制化开发需投入大量人力资源适配 相比直接使用英伟达卡增加时间成本和技术难度[8]
消息称砺算科技首款高性能GPU芯片成功点亮,国产GPU再添新锐力量
是说芯语· 2025-05-26 18:36
公司动态 - 东芯股份子公司砺算科技首款6nm高性能GPU芯片成功回片并点亮 标志着国产GPU在图形渲染与AI计算领域取得重大突破 [2] - 该芯片基于自研TrueGPU架构 拥有完全自主知识产权 支持主流图形API 具备高算力、大显存和低功耗特性 [2] - 芯片性能对标英伟达RTX4060系列 能支持3A游戏大作 已收获逾亿元预订单 [2] - 砺算科技由S3核心高管创立 产品性能达国际主流水平 获上市公司东芯股份强力支持 [3] 技术突破 - TrueGPU架构是业界首个融合高性能图形渲染和AI推理能力的GPU架构 [2] - 芯片在游戏、专业设计、智能汽车等领域有广泛应用前景 [2] - 有望打破海外长期垄断 填补国内高端GPU市场空白 [2] 产业影响 - 东芯股份作为国内领先存储芯片企业 持续加码半导体产业链布局 [3] - 砺算科技突破验证东芯股份在自研项目上的远见 有望强化其在高端芯片领域竞争力 [3] - 双方将在芯片研发、生态建设等方面深化合作 推动国产半导体产业升级 [3]
中电信息以4.84亿挂牌转让GPU企业中微电32.5%股权
巨潮资讯· 2025-05-17 11:46
股权转让 - 深圳中微电科技有限公司32.4778%股权被国资股东挂牌转让,转让底价4.84亿元,对应公司估值14.9亿元 [1] - 股权转让方为中国中电国际信息服务有限公司,为国务院国资委监管企业,此次"清仓式"转让已获股东批准 [2] 公司背景 - 公司为中国电子信息产业集团旗下企业,属于GPU研发领域的"国家队" [2] - 公司自2020年专注GPU研发,2022年首款高性能桌面GPU"南风一号"成功点亮并实现量产,2024年"南风二号"核心IP研发完成 [2] - 公司股权结构显示,除国资股东外,还吸引了红杉资本、力合创投等多家知名投资机构入股 [3] 财务状况 - 2023年公司营收5521万元,亏损8905万元 [2] - 2024年前十月亏损3854万元 [2] 行业现状 - 当前GPU赛道动辄百亿估值,中微电14.9亿元估值显得尤为低调 [1] - GPU研发面临持续巨额投入与激烈市场竞争的双重挑战,国际巨头占据主导地位 [2] - 在信创产业加速发展背景下,国产芯片企业需平衡技术突破与商业可持续性 [3] 未来发展 - 此次股权变动将影响公司未来发展,能否找到新的战略投资者接盘成为观察国产GPU产业走向的重要窗口 [3]
国产GPU的性能PK
傅里叶的猫· 2025-05-08 22:11
国产GPU性能对比 - 壁仞科技2022年推出的BR100性能最强,但因制裁无法量产,华为昇腾910C成为实际国产最强[1] - 华为昇腾910C性能达到英伟达H800的60%,海光BW100深算能力约400T(H800的50%),寒武纪590性能为H800的30%-35%[1] - 性能排名:华为910C > 海光BW100C > 华为910B > 百度/阿里自研卡 > 寒武纪 > 沐曦/天数智芯等[2] 产品价格动态 - 海光BW100采购价约10万元/张,华为910B和910C分别为7万和18万元,寒武纪590价格从8万-8.5万降至6万-7万[2] 显存技术现状 - 国内GPU普遍采用HBM2e显存(受制裁无法使用HBM3e),推理任务中显存容量是关键门槛,主流产品显存容量均达64GB[3] - 华为910C显存带宽达3.2TB/s显著领先,壁仞BR100为2.3TB/s,沐曦蔵云C500为1.8TB/s,多数厂商产品在0.5-1.8TB/s区间[4][5] 算力参数细节 - 壁仞BR100的BF16算力达445T,FP16算力1024T为表格中最高,华为910C BF16算力244T,沐曦蔵云C500 FP16算力280T[5] - 昆仑芯RG800显存带宽0.2TB/s,平头哥含光800* FP16算力202T,燧原逐思2.0显存带宽1.8TB/s[5] 技术迭代趋势 - 海光BW100采用先进交换芯片设计,单卡可用性能实测达87%,优于寒武纪590(约80%),反映后发技术优势[2] - 寒武纪MLU370-X8显存容量48GB(带宽0.6TB/s),较早期MLU270-S4(16GB/DDR4)有明显升级[5]