昇腾910C芯片

搜索文档
华为CloudMatrix384超节点:官方撰文深度解读
半导体行业观察· 2025-06-18 09:26
华为CloudMatrix384超节点发布 - 华为在2025华为云生态大会上推出CloudMatrix 384超节点,面向AI时代海量算力需求,基于"一切可池化、一切皆对等、一切可组合"的新型高速互联总线设计 [1] - 该架构实现从服务器级到矩阵级的资源供给模式转变,具备"高密、高速、高效"特点,在算力、互联带宽、内存带宽等方面全面领先 [2] - 架构突破传统分层设计,通过统一总线(UB)实现全节点直接通信,支持计算、内存和网络资源动态池化与独立扩展 [3] 架构核心特性 - 集成384个昇腾910C NPU和192个鲲鹏CPU,通过UB网络实现点对点全互联,节点间带宽衰减<3%,延迟增加<1µs [10] - 提供四项基础功能:1)支持TP/EP的可扩展通信 2)灵活的异构工作负载资源组合 3)统一的融合工作负载基础架构 4)通过分解式内存池实现内存级存储 [7][8] - 包含三个网络平面:UB平面(392GB/s单向带宽)、RDMA平面(400Gbps)、VPC平面(400Gbps),分别处理纵向扩展、横向扩展和外部连接 [12][14][16] 硬件配置细节 - 昇腾910C NPU采用双芯片封装,每封装提供752 TFLOPS BF16/FP16算力,128GB封装内内存,3.2TB/s内存带宽 [17][18] - 每个计算节点集成8个NPU+4个CPU+7个UB交换芯片,节点内UB带宽达392GB/s,RDMA带宽总计3.2Tbps [22] - 超级节点横跨16个机架(12计算+4通信),采用无阻塞双层UB交换拓扑,L2交换机分为7个子平面保持全系统无阻塞 [24][26] 软件生态系统 - CANN软件栈包含驱动层、运行时层和库层,实现与PyTorch/TensorFlow/MindSpore等框架的无缝集成,功能对标NVIDIA CUDA [27][28][30][33] - 云基础设施软件包括MatrixResource(资源管理)、MatrixLink(网络服务)、MatrixCompute(生命周期协调)和MatrixContainer(Kubernetes容器服务) [35][37] - ModelArts提供端到端AI平台服务,包含Lite(裸机访问)、Standard(完整MLOps)和Studio(MaaS)三个层级 [37] 性能表现与未来方向 - 在DeepSeek-R1模型测试中实现预填充6,688 tokens/NPU/秒和解码1,943 tokens/NPU/秒的吞吐量,延迟<50ms [57] - 未来演进方向包括:1)统一VPC和RDMA平面 2)扩展超级节点规模 3)实现CPU物理分解与池化 4)推进组件级微服务架构 [41][43][48][50] - 研究表明384 NPU配置可实现94%分配率,比224 NPU配置提升3个百分点,交换机利用率达100%且单位成本不变 [44][45]
通信行业2025年6月投资策略:高速光模块景气度持续,商业航天发展加速
国信证券· 2025-06-02 17:27
核心观点 - 5月通信板块表现强于大市,全球AI行业景气度持续,高速光模块需求高景气,我国民营火箭加速发展,建议关注AI云侧和端侧发展以及商业航天变化,长期配置三大运营商 [1][2][4] 5月行情回顾 - 5月通信板块上涨3.98%,跑赢大盘,在申万31个一级行业中排名第9 [1][14] - 5月通信板块估值回升,PE估值略微回暖,处于历史较低水平,PB估值处于历史高位水平 [18] - 各细分领域中,军工信息化、光模块光器件、卫星互联网分别上涨11.23%、10.58%、8.06%;5月涨幅前十的个股为德科立、新易盛、永鼎股份等 [26] 国内互联网云厂及英伟达AI投入情况 - 阿里2025Q1的Capex为246.12亿元,同比+120.68%,环比-22.54%;腾讯2025Q1的Capex为274.76亿元,同比+91.35%,环比-24.93%,两大巨头持续重视AI投入,AI投入正反馈得到验证,采用国产芯片、算力租赁等业务或成下一方向 [30][51] - 英伟达一季度净利润同比增长26%,数据中心业务营收同比增长73%,预计2026财年第二财季营收为450亿美元,GB200产量攀升,GB300升级版将推出,算力高景气度有望延续 [2][53] Stargate项目及相关企业投入 - Stargate星际之门项目由OpenAI、Oracle与软银联合发起,未来四年投入5000亿美元,初期1000亿美元已启动,OpenAI在阿联酋建设数据中心,G42承诺投资1000亿美元,AI浪潮有望全球性发展 [65][66] - Oracle计划斥资约400亿美元购买英伟达GB200芯片支持项目,xAI计划扩展GPU卡达100万张,成为AI基建新投入方,光模块头部厂商持续受益 [2][83][84] 万国数据与CoreWeave情况 - 万国数据2025Q1净收入为27.23亿元,同比增长12.0%,调整后EBITDA达13.24亿元,同比增长16.1%,斩获超大规模订单,预计全年总收入增长9.4%-12.3% [70][72] - CoreWeave引领算力租赁发展,2025年第一季度营收9.82亿美元,同比增长420%,与OpenAI达成合作协议,全球算力租赁景气度有望持续攀升 [73][79] 高速光模块与CPO技术 - 高速率光模块需求提升,受Oracle、xAI等加大AI投入推动,华为昇腾发布集群提升光模块需求,800G光模块出货量快速增长,光模块头部厂商受益 [83][84][89] - 英伟达、博通加速推动CPO技术发展,英伟达CPO方案降低能耗,博通推出第三代200G/lane的CPO方案 [96][97] 光纤情况 - 中国移动启动光缆集采,空芯光纤产业化加速,多模光纤需求旺盛,数据中心光缆需求呈现高景气度,单模和多模光纤光缆消费增长显著 [99][104][107] 智能模组情况 - 2025年Computex展各厂商发布AI终端新品,广和通发布5G模组FG390系列,美格智能发布SRM965智能座舱模组,展望6月火山引擎大会,豆包大模型家族将全面升级 [108][110][112] OpenAI收购情况 - 2025年5月22日,OpenAI以近65亿美元收购IO Products,旨在打造“AI原生入口设备”,引领端侧AI硬件“智能体”方向 [116] 全球PC与智能手机市场情况 - 2025年Q1全球PC市场出货量同比增长6.7%,受关税和AI PC普及推动,但增长可能难持续,市场份额向头部集中 [119] - 2025年Q1全球智能手机市场收入同比增长3%,由Apple、vivo及非前五大品牌推动,ASP同比上涨1% [120] 我国商业航天情况 - 我国规划新建多处商业发射工位,海南文昌规划四个,酒泉新规划四处,山东海阳招标新建液体火箭发射工位 [123][124][126] - 我国商业发射场加速建设,5月29日元行者一号验证型火箭飞行回收试验圆满成功,多个型号火箭对标SpaceX猎鹰9号,规划2025年首飞 [3][132] 我国电信业情况 - 我国电信业1-4月收入累计同比增长1%,移动电话用户规模稳中有增,5G用户占比近六成,移动互联网流量较快增长,5G网络建设有序推进,固定宽带接入用户稳步增长,千兆用户规模持续扩大,移动物联网用户较快发展,互联网电视用户增加 [135][136][139] 投资建议 - 持续关注AI算力设施,如光器件光模块(中际旭创、天孚通信等)、端侧模组(广和通等),关注商业航天变化,推荐关注卫星互联网(海格通信、上海瀚讯等) [4][141] - 中长期持续配置三大运营商,其经营稳健,分红比例持续提升,高股息价值凸显 [4][141]
国泰海通|电子:昇腾芯片拓展海外市场,加速全球AI平权
国泰海通证券研究· 2025-05-21 23:15
马来西亚AI主权战略部署 - 马来西亚通讯部副部长宣布推进人工智能基础设施战略 计划由昇腾GPU支持并采用DeepSeek大模型 [2] - 马来西亚首个主权生成式AI服务器AlterMatic DT250AI性能较业界平均水平高出20% 已获首相署等政府机构采用 [2] - Skyvast和利扬芯片计划2026年在多个基础设施区域部署3000个先进GPU 并获得马来西亚AI系统整合支持 [2] 昇腾芯片技术进展 - 昇腾910C单卡BF16算力达780 TFLOPS 接近H100的80%算力水平 [3] - CloudMatrix 384超节点实现单卡decode吞吐1920 tokens/s 与H100性能相当 [3] - 昇思MindSpore 2.6全面支持DeepSeek V3/R1 MoE模型训练推理全流程 并推出训推一体强化学习套件 [3] 国产算力海外拓展 - 马来西亚部署标志着国产算力芯片首次进入海外主权AI基础设施领域 [1] - 昇腾芯片软硬件架构持续迭代 商业生态逐步建立 未来海外市场拓展可期 [1][2] - 国产算力芯片竞争力持续提升 有望加速全球AI平权进程 [1][3]
【大涨解读】华为产业链:AI进展迅速,华为再度成为市场焦点,5月还有鸿蒙PC等催化
选股宝· 2025-05-06 14:09
行情表现 - 华为产业链5月6日大涨,川润股份、常山北明实现2天2板,华胜天成、天源迪科等个股涨停 [1] - 川润股份最新价10.75元,涨幅+10.03%,换手率18.60%,流通市值41.57亿元 [2] - 常山北明最新价24.82元,涨幅+10.02%,换手率16.25%,流通市值394.09亿元 [2] - 天源迪科涨幅达20.00%,换手率23.32%,流通市值89.71亿元 [2] - 九联科技涨幅+20.02%,换手率8.51%,流通市值58.15亿元 [2] 华为技术突破 - CloudMatrix 384超节点基于384颗昇腾芯片构建,提供300PFLOPs密集BF16算力,接近英伟达GB200NVL72系统的两倍 [3] - 该系统通过全互连拓扑架构实现芯片高效协同,已在芜湖数据中心等场景规模上线 [3] - 单颗昇腾芯片性能为英伟达Blackwell GPU的1/3,但芯片数量优势使整体性能反超 [5] - 系统总内存容量超英伟达方案3.6倍,内存带宽提升2.1倍 [5] - 高带宽低延迟架构使MoE模型推理效率大幅提升,减少跨服务器通信需求 [5] 鸿蒙电脑发布 - 华为宣布5月发布搭载鸿蒙系统的电脑,实现从内核到应用全栈自研 [4] - HarmonyOS5已实现内核重构,整机性能提升40%,强化跨设备协同能力 [5] - 鸿蒙电脑集成AI能力如"AI眼动翻页"和盘古大模型智能助手,重塑PC交互体验 [5] - 硬件可能搭载自研鲲鹏处理器,填补国产专业领域空白 [5] 产业链影响 - 液冷技术需求因集群密度提升而增长,电源供应链企业将受益于功耗上升 [5] - 昇腾芯片规模化部署将带动晶圆代工厂商需求 [5] - 高速连接器、PCB/CCL供应商有望获得增量订单 [5] - 多相控制器供应商将在AI集群建设中实现价值量提升 [5] - 鸿蒙生态形成国产化标志,B端/G端应用有望在信创背景下加速适配 [5]
告别「英伟达依赖」,车企掀起换「芯」潮
创业邦· 2025-04-30 11:03
英伟达紧急访华与芯片产业格局变化 - 英伟达创始人黄仁勋紧急访华,因美国对华芯片出口限制导致H20芯片受限,股价暴跌,需寻找中国市场突破口 [6] - 黄仁勋表示中国是英伟达非常重要的市场,希望继续合作 [6] - 中国加速国产芯片替代,车规级芯片国产化成为整车厂核心诉求 [6] 整车厂的紧急任务 - 美国芯片出口管制导致国内市场恐慌,部分代理商借机囤货涨价,采购难度加大 [8] - 中国半导体行业协会发布"流片地认定为原产地"规则,堵住境外封装规避关税路径 [8] - 深圳华强北芯片价格上涨,部分型号存储芯片单日涨幅20% [8] - 电动车芯片需求达1600颗,智能汽车需求有望提升至3000颗 [8] - 麦格纳和舜宇光学等一级供应商积极寻找国产替代方案,接触索尼和豪威科技 [8] 国产芯片需求激增 - 索尼询价客户量翻倍,预计2025年出货量增加50%-90% [10] - 韦尔股份2024年营收增长22.4%,净利润增长498%,汽车传感器业务增长23.5% [10] - 晶方科技2024年营收增长23.7%,归母净利润增长68.4% [10] - 雅创电子国产芯片询价客户激增,整车厂接受度提高 [10] - 英伟达Drive Orin-X系列2024年装机量210万颗,占比近40%,华为昇腾、地平线和黑芝麻成为主要替代选择 [10] - 比亚迪原计划2025年采购70%地平线芯片,英伟达份额逐步下降 [10] 国产芯片"抢位赛" - 芯片上车需3-6个月测试流程,且需消耗库存,短期内销量无法大幅提升 [12] - 中腰部芯片厂商内卷,提供成本价甚至低于成本价的优惠承诺 [13] - 人才争夺战激烈,厂商高价挖角竞争对手人才 [13] - 比亚迪自研碳化硅功率芯片,小鹏自研"图灵AI芯片"算力达700 TOPS,蔚来自研5纳米"神玑NX9031"芯片量产装车 [13] - 蔚来自研芯片可节约成本约1万元,打破英伟达在智驾算力领域的垄断 [13]
通用算力相对过剩 智能算力相对短缺 中国算力市场的成长烦恼
上海证券报· 2025-04-29 04:33
算力市场结构性失衡 - 我国算力市场呈现"通用算力相对过剩,智能算力相对短缺"的结构性矛盾,部分老旧算力中心闲置,而符合时代需求的智能算力供给不足 [3][6] - 三大运营商大踏步加码算力投资,中国移动2025年算力预算为373亿元占总资本开支25%,中国联通算力投资计划增长28%,中国电信算力投资同比增长22% [4][5] - IDC预测2025年中国智能算力规模将达到1037.3EFLOPS,2028年达到2781.9EFLOPS [5] 供需失衡具体表现 - 我国IDC机柜平均上架率约58%,部分地区PUE超过2.5,显示存在闲置算力 [6] - 按地域分布看,胡焕庸线东部算力基本满载满租,西部地区供需关系相对宽松 [7] - 按算力质量看,计算性能强、配套软件服务好的智能算力相对稀缺,如优刻得内蒙古数据中心一柜难求 [7] 结构性失衡原因 - 算力需求高速迭代,早期通用AI算力面临淘汰,高端智能算力产能不足,2025年预计需要300万张GPU但产能有限 [8] - 部分卖方对智算中心认知有限,建设的数据中心性能不足,存在5%-10%掉卡率且缺乏自动化迁移能力 [9] - 部分买方对自身需求认知不充分,不具备使用数据中心能力,导致利用率不理想 [9][10] - 西部地区建设成本低但网络延迟高(达100毫秒),导致地域性错配 [10] 行业优化方向 - 算力调度层面:出现"算力合伙人"模式整合闲置资源,优刻得已开始管理空闲硬件资源 [10][11] - 地域优化:"东数西存"、"东数西训"、"东数西渲"成为趋势,将不同需求任务合理分配至东西部 [12] - 硬件层面:国产高端算力加速发展,华为昇腾910C性能接近英伟达H100的80%,昇腾920或2025年量产 [13] - 软件层面:模型厂商与芯片厂商合作开发中间层软件,如商汤与华为昇腾、寒武纪合作研发基础算子库 [13] 市场动态 - 4月多家上市公司披露数据中心项目中标:城地香江中标5.95亿至24.33亿元项目,平治信息中标4.6亿元项目 [4] - 同期多家公司终止算力合同:飞利信、莲花控股、锦鸡股份等因业务未开展或服务器未供货终止合作 [2][5]
“摆脱英伟达”就快要实现了?
阿尔法工场研究院· 2025-04-24 20:19
国产芯片崛起与英伟达垄断格局打破 - 英伟达创始人黄仁勋紧急访华,因美国对华芯片出口限制导致H20芯片受限,股价暴跌,中国市场重要性凸显[4] - 中国加速国产芯片替代,车规级芯片国产化需求激增,整车厂寻求替代方案以摆脱美国标签[4][5] - 国产车规级芯片询价需求爆发,某驱动控制器芯片公司客户询价量增长3倍,样品销量翻倍[5] 整车厂供应链调整与芯片国产化 - 美国芯片出口管制引发国内市场恐慌,部分代理商囤货涨价,采购成本上升[7] - 中国半导体行业协会发布"流片地认定为原产地"规则,堵住境外封装规避关税路径[8] - 深圳华强北芯片价格单日涨幅达20%,整车厂及供应商积极寻找国产替代方案[8][9] 智能汽车芯片需求与供应链变化 - 智能汽车芯片需求量达3000颗,远超传统燃油车(600-700颗)和电动车(1600颗)[10] - 中国新能源汽车占全球70%市场份额,车载摄像头需求攀升至10-13颗/车,CIS芯片成本占模组一半[12] - 麦格纳、舜宇光学等一级供应商转向索尼、豪威科技询价,以替换安森美芯片[12] 国产芯片厂商业绩与市场机会 - 韦尔股份2024年营收增长22.4%,净利润增长498%,汽车传感器业务增长23.5%[15] - 晶方科技2024年营收增长23.7%,净利润增长68.4%,受益于汽车智能化推进[15] - 雅创电子国产芯片询价客户激增,整车厂接受度提升,大车企愿意测试样品[15] 智驾芯片市场竞争格局 - 英伟达Drive Orin-X系列2024年装机量210万颗,占智驾芯片市场近40%[15] - 华为昇腾910B订单爆满,计划5月出货910C芯片,地平线、黑芝麻采购量增加[15] - 比亚迪原计划2025年采购70%地平线芯片,现进一步降低英伟达份额[15] 国产芯片替代的挑战与策略 - 芯片上车需3-6个月测试流程,库存消化延缓订单放量[17] - 中腰部芯片厂商内卷,50万颗采购量可获成本价,更高量单价低于成本线[17] - 人才争夺激烈,厂商高价挖角竞争对手人才[18] 车企自研芯片进展 - 比亚迪自研碳化硅功率芯片量产,主打自供和中低端市场[19][21] - 小鹏自研"图灵AI芯片"算力达700 TOPS,Q2量产上车[21] - 蔚来5纳米"神玑NX9031"芯片量产装车,单颗替代4颗英伟达Orin X,成本节约1万元[21]
告别英伟达依赖,车企换“芯”潮来了
投中网· 2025-04-24 14:29
国产芯片替代趋势 - 英伟达因美国出口管制导致股价暴跌,创始人黄仁勋紧急访华寻求中国市场突破[5][6] - 中国整车厂加速国产芯片替代,车规级芯片询价需求增长3倍,样品销量翻倍[7] - 整车厂核心诉求是提高国产化比例,排除美国芯片以控制采购成本和量产计划[7][18] 关税政策影响 - 中国将进口芯片原产地认定规则改为"流片地认定",堵住境外封装规避关税路径[10][11] - 深圳华强北芯片价格单日涨幅达20%,存储芯片受冲击显著[12] - 特朗普政府对华关税提升至125%,中国反制加剧半导体市场动荡[10] 车规级芯片需求激增 - 电动车芯片需求达1600颗/辆,智能汽车需求升至3000颗/辆,驱动国产替代[13] - 车载摄像头需求攀升至10-13颗/车,CIS芯片占模组成本50%[15] - 麦格纳、舜宇光学等一级供应商积极寻找安森美CIS芯片替代方案,接触索尼和豪威科技[15][16][17] 国产芯片厂商表现 - 韦尔股份2024年营收增长22.4%,净利润增长498%,汽车传感器业务增长23.5%[21] - 晶方科技2024年营收增长23.7%,净利润增长68.4%,受益汽车智能化[21] - 华为昇腾910B订单爆满,计划2025年出货量增长50%-90%[20][21] 车企自研芯片进展 - 比亚迪自研碳化硅功率芯片量产,覆盖中低端市场[28][29] - 小鹏自研"图灵AI芯片"算力达700TOPS,Q2量产上车[29] - 蔚来自研5nm神玑NX9031芯片量产装车,单颗替代4颗英伟达Orin X,成本节约1万元[29] 行业竞争格局 - 英伟达Drive Orin-X系列2024年装机量210万颗,占智驾芯片市场40%[21] - 国产芯片厂商通过价格战抢占市场,50万颗订单可享成本价[24] - 人才争夺战加剧,企业高价挖角竞争对手技术人才[26]