BR100

搜索文档
国产GPU六龙争霸,工信部发声支持行业突破
新浪财经· 2025-08-26 01:26
行业背景与政策支持 - 工信部发声支持GPU发展 推动国产GPU行业竞争加剧[1] - 科技股行情带动指数突破3800点 行业处于政策利好周期[1] 主要企业竞争格局 - 国产GPU领域形成六家企业主导的竞争格局 被喻为"六龙争霸"[1] - 摩尔线程为全功能GPU厂商 MTT S80可运行3A级游戏大作 驱动每月更新 S2000智算集群推动OISA标准 Pre-IPO估值达255亿元[1] - 景嘉微被誉为行业"黄埔军校" JM9系列性能接近GTX1050 在党政/金融领域国产替代占比达40% JM11系列瞄准通用计算领域[1] - 壁仞科技BR100算力超越国际旗舰产品3倍 主要服务国家超算中心与行业巨头 虽被美国列入实体清单 但成为国产替代急先锋[2] - 沐曦集成曦云C500已实现量产并交付万卡规模 C600将支持FP8精度 兼容CUDA生态 成为国产规模化主力军[3] - 砺算科技计划2025年推出6nm制程产品 性能可超越RTX4060 支持数字孪生与乱序渲染 采用纯自研架构 为科创板东芯股份联营公司[4] - 海光信息为全市场唯一CPU、GPU(DPU)双龙头企业 也是唯一形成生态的通用芯片公司 产品包括海光7000 CPU和深算一号/二号GPU 广泛应用于服务器、金融、互联网及AI领域 具备显著稀缺性[5] 技术发展现状与差距 - 国产GPU短期难以赶上英伟达、AMD、英特尔等国际巨头 国内初创企业研发投入规模在10亿元级别、团队规模数百人、研发时间两三年 与国际企业存在巨大差距[5] - 行业发展趋势可参考家电、汽车、手机等产业路径 预计需要10-20年时间可能实现技术追赶[5] 行业前景与投资机遇 - 人工智能行业类似早期互联网行业 将深刻改变人类生活 孕育大批高增长企业 发展周期将持续较长时间[5] - 投资参考微软上市初期或互联网泡沫破裂后的布局时机 存在长期投资机遇[5]
AI算力底座持续变化,两家国产AI芯片公司离上市再近一步
第一财经· 2025-06-24 14:43
全球算力路径演变 - 全球算力路径将演变为两条并行路线,海内外路径有所不同 [1] - 目前全球98%大模型训练的算力基座仍是英伟达,但国内部分预训练可能转向非英伟达卡 [4] - 国产芯片在推理场景的机会将逐渐显现 [1][4] AI芯片公司上市进展 - 沐曦已完成上市辅导,摩尔线程进入辅导验收阶段 [1] - 燧原科技和壁仞科技处于辅导备案状态 [1] - 四家公司中摩尔线程估值最高达255亿元,燧原科技160亿元,壁仞科技155亿元,沐曦100亿元 [2] 公司背景与产品 - 摩尔线程创始人张建中曾任英伟达中国区总经理,沐曦三名创始人来自AMD [2] - 摩尔线程推出MUSA统一GPU架构,被称为"国产英伟达" [2] - 沐曦产品线包括曦思N系列、曦云C系列和曦彩G系列GPU [2] - 燧原科技聚焦云端训练,壁仞科技2022年推出对标英伟达A100的BR104 [2] 市场需求变化 - 国产芯片公司积极适配DeepSeek-R1模型 [3] - 去年采购的国产算力在今年第一季度被DeepSeek占用 [3] - 去年中国数据中心加速卡市场中34.6%为国产算力,预计今年上半年可能超40% [3] 融资与产业布局 - 上海国投先导人工智能产业母基金联合领投壁仞科技 [4] - 这是上海国资在AI生态布局中的重要项目 [4]
国产GPU的性能PK
傅里叶的猫· 2025-05-08 22:11
国产GPU性能对比 - 壁仞科技2022年推出的BR100性能最强,但因制裁无法量产,华为昇腾910C成为实际国产最强[1] - 华为昇腾910C性能达到英伟达H800的60%,海光BW100深算能力约400T(H800的50%),寒武纪590性能为H800的30%-35%[1] - 性能排名:华为910C > 海光BW100C > 华为910B > 百度/阿里自研卡 > 寒武纪 > 沐曦/天数智芯等[2] 产品价格动态 - 海光BW100采购价约10万元/张,华为910B和910C分别为7万和18万元,寒武纪590价格从8万-8.5万降至6万-7万[2] 显存技术现状 - 国内GPU普遍采用HBM2e显存(受制裁无法使用HBM3e),推理任务中显存容量是关键门槛,主流产品显存容量均达64GB[3] - 华为910C显存带宽达3.2TB/s显著领先,壁仞BR100为2.3TB/s,沐曦蔵云C500为1.8TB/s,多数厂商产品在0.5-1.8TB/s区间[4][5] 算力参数细节 - 壁仞BR100的BF16算力达445T,FP16算力1024T为表格中最高,华为910C BF16算力244T,沐曦蔵云C500 FP16算力280T[5] - 昆仑芯RG800显存带宽0.2TB/s,平头哥含光800* FP16算力202T,燧原逐思2.0显存带宽1.8TB/s[5] 技术迭代趋势 - 海光BW100采用先进交换芯片设计,单卡可用性能实测达87%,优于寒武纪590(约80%),反映后发技术优势[2] - 寒武纪MLU370-X8显存容量48GB(带宽0.6TB/s),较早期MLU270-S4(16GB/DDR4)有明显升级[5]