超节点

搜索文档
海内外算力共振,AIDC景气将持续
德邦证券· 2025-07-07 17:25
报告核心观点 报告认为AI应用数据向好、端侧应用高景气,国内外算力需求共振,供给侧持续升级,国产算力厂家进入IPO阶段,通信行业虽本周走势弱于上证指数,但AI算力链条投资机会值得关注,各细分领域也有诸多动态和发展趋势[4][7][21] 投资策略 投资要点 - AI应用数据向好,端侧应用高景气,ChatGPT成AI超级应用,国产应用表现佳,OpenRouter平台token消耗量大幅增长,亚马逊机器人部署达100万台且效率将提升[4][12] - 中国移动推理侧订单释放,甲骨文新增订单多,国内外算力需求共振,中国移动成立人工智能公司并发布大模型矩阵[4][13] - 供给侧升级,辉达GB300 NVL72出货,我国算力供应提升,沐曦股份、摩尔线程IPO获受理[4][14] 行业要闻 - 中国移动AI服务器集采标包6公示,规模超32亿,其投资将拉动下游产业链,建议关注相关公司[5][16] - 《可信数据空间标准化研究报告》研讨会召开,推进标准化工作,数据要素领域放量节点将近,建议关注相关公司[7][17] - 国产算力芯片厂商沐曦股份、摩尔线程IPO获受理,发展进入新阶段,有望规模化发展,建议关注相关公司[7][18] - AI应用需求增长,字节旗下Cici出海增速领先,算力链条有望维持高景气度,建议关注相关公司[7][20] 本周回顾及重点关注组合 - 本周通信板块下跌0.16%,弱于上证指数,部分板块有涨跌表现,建议关注AI算力链条投资机会,还给出周涨跌幅前十和后十股票[7][21][23] - 下周关注AI算力链条相关公司,长期关注运营商、通信基建等多领域相关公司[25] 行业新闻 运营商板块 - 中国电信启动UIM普卡及物联网卡集采,共计33893万张[26][31] - 中国移动成立中移九天人工智能科技公司,注册资本20亿元[13][27] 主设备板块 - 中国移动高端路由器和高端交换机产品集采,华为、中兴等中标部分标包,预估采购规模明确[27] - 中国铁塔2025年度电力电缆集采大单候选人公示,俊知、中天、亨通排名前三,项目规模约6.88亿[28] 光通信板块 - 中国移动8000万米铠装跳纤产品集采,通鼎宽带等六家中标[29] - LightCounting称AI带来DWDM流量增长,运营商应提前准备[29][30] 物联网板块 - 工业和信息化部物联网标准化技术委员会成立,推进物联网标准体系建设[30] - 中国电信启动UIM普卡及物联网卡集采,共计33893万张[26][31] 智能终端板块 - 5月国内市场手机出货量大幅下降21.8%,拖累全年累计增速转负[31] - 亚马逊全球部署100万台机器人,推出DeepFleet模型提升效率,自称全球最大移动机器人制造商和运营商[32][33] 数据中心板块 - 华为宣布开源盘古7B稠密和72B混合专家模型,推动大模型技术发展[33] 工业互联网 - 中国广电四川公司5G双域专网与广域专网用户面设备上线,开通首个商用业务[34] - 中国工业互联网研究院发布未来产业产业链培育服务平台,支撑未来产业发展[34] 低空经济 - 河南首只低空产业基金备案,总规模20亿,将推动低空经济全产业链发展[34] - 成都出台14条政策措施培育低空经济市场,涉及基础设施、监管、应用等方面补贴和奖补[35] 上市公司公告 - 江苏中天科技子公司中标多个海洋能源项目,金额约17.22亿[36] - 深圳市桑达实业出售中电(淄博)能源科技80%股权,交易价13012.83万元[37] - 深圳市菲菱科思截至6月30日累计回购股份454300股,成交金额34382590.35元[39] - 中电科普天科技持股5%以上股东减持股份触及1%[40] - 深圳市三旺通信持股5%以上股东减持股份计划实施完毕,累计减持2991248股[41] - 广东九联科技部分股东及董监高、核心技术人员拟减持股份,给出具体减持计划[42][43] 大小非解禁、大宗交易 - 本周多家公司有大小非解禁情况,给出解禁日期、数量等信息[45] - 本周多只股票有大宗交易,给出交易日期、成交价等信息[46]
华为芯片,让英伟达黄教主坐不住了
21世纪经济报道· 2025-07-07 16:56
核心观点 - 华为昇腾CloudMatrix 384超节点在部分性能上超越英伟达GB200机柜,整体计算能力达后者的1.6倍[1][13] - 昇腾通过集群化设计弥补单芯片性能差距,实现从"备胎"到"主力"的转变,成功训练出千亿参数大模型[3][6][32] - 昇腾在算力利用率(MFU)上达到全球一流水平,稠密模型MFU超50%,MoE模型达41%-45%[9][10] - 昇腾384超节点采用光互联等系统性工程突破,实现384芯片高效协同,技术路径与英伟达差异化[16][21][29] 技术性能对比 - 单芯片性能为英伟达Blackwell的三分之一,但384超节点通过5倍芯片数量实现系统算力反超[13] - 推理性能对标英伟达H100,在DeepSeek-R1模型测试中算力利用率获全场最佳[11] - 英伟达GB200机柜仅集成72块GPU(下一代144块),华为突破384芯片互联技术[19][20] 技术路径创新 - 采用全对等互联架构与光缆连接,传输效率优于英伟达NVLink铜缆方案[27][29] - 结合鲲鹏CPU与昇腾NPU协同优化,实现"数学补物理"的系统级创新[24][32] - 自研CANN软件栈替代CUDA生态,支持分钟级故障恢复等工程优化[32] 行业竞争格局 - 国内AI芯片形成三大派系:科技巨头(华为/百度/阿里)、纯芯片厂商(寒武纪/燧原等)、细分领域企业(地平线等)[36] - 英伟达仍保持3nm工艺领先优势,CUDA生态历史积淀深厚[33][34] - 美国制裁背景下,昇腾在中国市场加速替代英伟达H20受限产品[36][37] 发展前景 - 华为通过"面积换性能"策略开辟中国特色技术曲线,实现弯道超车[38][39] - 昇腾已验证国产芯片训练千亿参数模型能力,标志国产算力进入实用阶段[6][40]
华为芯片,究竟有多牛(下)
21世纪经济报道· 2025-07-07 11:18
0:00 21世纪经济报道记者倪雨晴 深圳报道 华为昇腾是怎么做到和英伟达"掰手腕"的? 技术拆解 要理解这个问题,我们得先来认识昇腾的最强战力,"CloudMatrix 384 超节点"这个大家伙。这就是它 的外观(画面:384的结构图),它其实就是一个巨大的芯片集合,这最核心的384张昇腾910芯片,外 加192颗鲲鹏CPU,通通塞进16个机柜,然后用光缆、光模块联接起来,构成一个"超节点"。 你可以把它想象成一支超级"AI方阵":虽然单个士兵不如对手,但整体配合、纪律、调度都非常出色。 最终打起仗来,不一定会输。 听起来是不是有点像"芯片大拼盘"?但是,要把384块芯片联接在一起,像一台机器一样高效工作、协 同配合,这可不简单。 你可能不知道,英伟达目前GB200的机柜,只塞了72块GPU,下一代是144块GPU, 这个"大力出奇迹"的背后,是通信、光学、热学、基础软件等多个领域的老底子,一起发力的结果。 核心突破点包括: 听上去有点技术?咱们展开说说一项很关键的互联技术。 在计算集群里,无论是 CPU、GPU 还是 NPU,最终都需要高效的联接起来,才能交换传输数据。 英伟达有独家的NVLink互联技 ...
华为芯片,究竟有多牛?(上)
21世纪经济报道· 2025-07-06 11:12
0:00 21世纪经济报道记者倪雨晴 深圳报道 华为的昇腾,让英伟达黄教主都坐不住了。他公开表示,华为昇腾CloudMatrix 384超节点,部分性能上 甚至超过英伟达的产品。 华为的384超节点方案,就像全真七子用剑阵打黄药师,集群一起上,黄药师还真有点招架不住。 海外专业机构SemiAnalysis更是直接点名:384超节点的整体计算能力是英伟达GB200机柜的1.6倍! 在单芯片性能受限、制裁持续的情况下,华为昇腾是真能打,还是"自嗨"?它是如何与英伟达竞争的? 国产算力究竟到了什么水平?还有什么差距? 今天,我们就带着这些问题,一口气了解对垒英伟达的国产芯片,昇腾。 和英伟达"掰手腕" 目前昇腾最主力的产品叫"昇腾910"。但以往的昇腾芯片,更多是作为"备胎"使用的——因为美国断 供,英伟达、AMD最高端的芯片买不到,很多厂商只能硬着头皮用国产,而昇腾已经是国产芯片中的 佼佼者。 过去几年,昇腾其实主要用在AI"推理"环节,也就是模型训练好之后,用它来支持大模型生成内容、聊 天等应用环节。但模型训练?说实话——很少用国产芯片,原因也简单:单卡性能弱、生态不够用、系 统稳定性差。 但这一切,在2024 ...
2025年下半年计算机行业投资策略报告:聚焦AI智能化、国产化-20250703
上海证券· 2025-07-03 17:51
报告核心观点 - 2025年下半年计算机行业聚焦AI智能化与国产化,大模型持续创新、AI Agent商业化加快,政策与生态共振推动自主可控全面加速,建议关注算力、AIDC、AI应用等领域相关公司 [3][4] 模型端 - 国内外大模型加速迭代,OpenAI、谷歌、Anthropic等推出新模型,主流大模型在智能、效率和多模态能力方面持续进步 [3][6] - 展示SuperCLUE测评基准2025年5月部分模型总体表现,涵盖数学推理、科学推理等多维度测评结果 [6] 算力端 - 科技大厂持续加码AI算力资本开支,海外微软、亚马逊等,国内阿里、腾讯、百度等均有投入 [14] - 推理算力需求井喷,巴克莱报告预计其占通用人工智能总计算需求70%以上,行业或需增加近3000亿美元芯片资本支出,ASIC及国产芯片迎发展机遇 [14] 应用端 - 科技巨头在B端和C端加速布局AI Agent,推动商业化落地,C端多款Agent涌现 [19] - 巨头积极拥抱MCP协议,有望拓展AI应用和Agent边界,降低开发门槛 [19] - AI Agent市场发展潜力大,全球市场预计从2024年51亿美元增长到2030年471亿美元,年复合增长率44.8% [19] 信创 - 关税摩擦升级,政策强调推进关键核心技术攻关,内部政策或加速科技和供应链自主可控 [22] - 国资委要求2027年底前中央企业信息化系统安可信创替代,中科曙光与海光信息战略重组推动信创产业自主高端化 [22] - 华为推出CloudMatrix超节点集群,新一代昇腾AI云服务上线,为超1300家客户提供算力 [23] - 华为发布原生鸿蒙,市场份额提升,鸿蒙PC发布实现国产PC全栈自主可控,预计年底超2000个应用完成适配 [23] 投资建议 - 建议关注算力领域昇腾链、寒武纪等公司,AIDC领域科华数据等公司,AI应用领域金山办公等公司 [4][24]
华为CloudMatrix384超节点很强,但它的「灵魂」在云上
机器之心· 2025-07-02 19:02
机器之心报道 编辑:Panda AI 领域最近盛行一个观点: AI 下半场 已经开始,评估将比训练重要。而在硬件层级上,我们也正在开始进入一个新世代。 过去几年,全球科技巨头的 AI 竞赛还聚焦于「芯片」本身 —— 比拼谁的计算核心更强大,就像 F1 赛场上对引擎马力的极致追求。而今天,战火已经蔓延到一个 更宏大的新维度: 系 统架 构 。 当所有顶级玩家都拥有了性能强悍的「V12 引擎」后,人们痛苦地发现,真正的瓶颈已不再是单颗芯片的算力,而是如何将成百上千颗芯片连接起来,形成一个 高效协同的整体。这就像将一千辆 F1 赛车同时塞进一条乡间小路,再强的引擎也只能在无尽的「堵车」中怠速轰鸣。 这个「交通堵塞」,就是今天 AI 数据中心面临的最致命瓶颈 —— 通信开销。在大模型分布式训练中,节点间的海量数据同步,常常导致算力利用率骤降。无数 斥巨资采购的顶级芯片,大部分时间都在等待数据,而不是在计算。也就是说,AI 行业正面临一场深刻的效率危机。 因此,一个根本性的问题摆在了所有人的面前:如何才能彻底拆除芯片之间的「围墙」,构建一个真正没有堵车的「算力高速公路网」? 面对这个 AI 下半场的终极考题,华为云给出 ...
科创板迎硬核玩家:沐曦IPO获受理 ,国产GPU上市提速
21世纪经济报道· 2025-07-01 20:52
沐曦IPO及募资计划 - 沐曦科创板IPO获受理,拟募资39.04亿元,主要用于新一代通用GPU、AI推理芯片及前沿异构计算架构的研发与产业化 [1] - 公司成立仅五年,被视为国产算力挑战国际巨头的生力军之一,目前仍处于亏损状态 [1] - 沐曦GPU产品累计销量超过25000颗,已在多个国家人工智能公共算力平台和商业化智算中心实现规模化应用 [3] 公司财务及研发投入 - 2022年—2024年营收分别为42.6万元、5302.1万元和7.43亿元,增速显著,但同期净亏损7.8亿元、8.7亿元、14.1亿元,三年总亏30.6亿元 [3] - 最近3年累计研发投入占营业收入比例高达282.11%,累计研发投入金额为22亿元 [3] - 亏损原因包括国产芯片渗透率低、技术标准适配及用户习惯迁移障碍、大额研发投入和股份支付费用等 [3] 行业竞争格局 - 国内AI芯片市场渗透率显著上升,但仍处于发展初期,竞争格局未明朗 [1] - 主要竞争对手包括海光信息、天数智芯、壁仞科技、摩尔线程(通用GPU)及华为海思、寒武纪、昆仑芯、燧原科技(专用ASIC/DSA) [1] - 国产GPU厂商在软硬协同、自主IP等方面取得实质性进步,但与国际巨头英伟达在制程工艺、CUDA生态等方面仍有差距 [5] 产品与技术 - 沐曦核心产品包括通用GPU"曦云C系列"、推理GPU"曦思N系列"、图形渲染GPU"曦彩G系列",主要面向数据中心市场 [2] - "曦云C系列"基于全自研GPU IP、指令集和架构,在通用性、单卡性能、集群性能等方面达到国内领先水平 [3] - 公司构建MXMACA软件生态,兼容主流标准 [3] 政策与市场环境 - 科创板深化改革"1+6"政策为尚未盈利但拥有核心技术的"硬科技"企业提供上市便利 [4] - AI大模型兴起、"东数西算"工程推进及美国对AI芯片管制加速国产GPU替代进程 [5] - 预计2025年中国AI服务器市场中,国产芯片占比将增至40%,英伟达等企业占比降至41.5% [7] 国产GPU生态发展 - 国产GPU生态迈入体系化、工程化建设新阶段,从芯片研制到生态支撑需长期技术积累 [7] - 科技巨头(华为、百度等)、纯芯片厂商(寒武纪、沐曦等)及细分市场企业(地平线等)三大派系共同推动国产化 [5][6][7] - 华为昇腾、百度昆仑芯等已实现技术突破,与GPU厂商形成协同效应 [6]
媲美千亿级模型,华为首个开源大模型上线
选股宝· 2025-07-01 07:32
华为开源大模型技术 - 华为宣布开源盘古70亿参数的稠密模型和720亿参数的混合专家模型(盘古Pro MoE 72B),并同步开源基于昇腾的模型推理技术 [1] - Pro MoE 72B大模型在参数量720亿、激活160亿参数量的情况下,通过动态激活专家网络设计,实现媲美千亿级模型的性能表现 [1] - 该模型在Super CLUE 2025年5月排行榜上位居千亿参数量以内大模型排行并列国内第一 [1] - 华为云计算CEO表示开源有助于开发者基于国产算力平台开发大模型技术,扩展昇腾生态,并推动大模型赋能各行业 [1] - 招商证券指出华为盘古5.5发布718B参数MOE架构大模型,涵盖自然语言、视觉、多模态等领域,并推出"世界模型"赋能自动驾驶等行业应用 [1] 华为AI算力解决方案 - 华为提供从昇腾芯片、CANN异构计算架构、超节点到盘古大模型的完全自主、深度优化的闭环解决方案 [2] - 昇腾超节点已在中国电信等数据中心商用落地,带动国内供应链发展 [2] - 全球AI算力竞争转向大规模系统效能、生态构建与产业链能力全面对抗,华为重塑中美对立下的新算力格局 [2] 相关公司动态 - 华胜天成与华为在昇腾芯片、AICC智能联络中心等方向展开广泛协作 [3] - 软通动力推出软通昇腾AI工作站,提升AI本地化推理与生产效率 [4]
【IPO一线】摩尔线程科创板IPO获受理 募资80亿元投建图形芯片/AI训推一体芯片等项目
巨潮资讯· 2025-06-30 21:19
公司概况 - 摩尔线程于2020年成立,专注于GPU及相关产品的研发、设计和销售,以全功能GPU为核心技术 [1] - 公司已推出四代GPU架构,产品覆盖AI智算、高性能计算、图形渲染、计算虚拟化、智能媒体及个人娱乐与生产力工具等领域 [1] - 新一代GPU架构产品处于研发阶段,同步推进高性能GPU芯片和智算集群前沿技术预研 [1] 产品矩阵 AI智算产品线 - 包括AI训练智算卡、AI推理卡、AI超节点服务器及夸娥(KUAE)智算集群,服务于AI计算中心、云服务平台等场景 [2] - AI训练智算卡与AI推理卡为MoE混合专家模型、多模态模型、世界模型等优化设计,具备高性能与能效比 [2] - 夸娥(KUAE)智算集群可扩展至万卡规模,支持超大参数模型预训练、多租户云服务与分布式推理 [2] 专业图形加速产品 - 应用于工业设计、高清视频编辑、数字孪生、AI云电脑等高端场景,包括MTT S3000/S2000/S1000系列显卡及一体机解决方案 [3] - 支持Windows、麒麟KylinOS、统信UOS、openEuler等操作系统,兼容Intel、AMD、海光、飞腾、鲲鹏等CPU平台 [3] 桌面级图形加速产品 - 覆盖AI PC、游戏PC及办公PC场景,包括MTT S80/S70/S50/S30/S10/X300/X100系列显卡及工作站 [3] 智能SoC类产品 - 应用于AI PC、边缘智能、具身智能、智能汽车和低空经济等领域,包括AI算力本-A140、AI模组-E300等 [3] - 可与AI智算产品结合,形成云–边–端一体化解决方案 [3] IPO募资计划 - 拟募资80亿元,投向新一代自主可控AI训推一体芯片、图形芯片、AI SoC芯片研发项目及补充流动资金 [4] - 募投项目旨在提升现有产品性能,推进迭代与技术创新,扩大主营业务规模,增强核心竞争力与市场占有率 [4] 战略规划 - 以全功能GPU为核心,提供计算加速基础设施和一站式解决方案,支持各行业数智化转型 [4] - 目标成为具备国际竞争力的GPU领军企业,为AI和数字孪生领域打造先进计算加速平台 [4]
超节点的光互联和光交换
傅里叶的猫· 2025-06-27 16:37
以下文章来源于傅里叶的猫AI ,作者猫叔 傅里叶的猫AI . 傅里叶的猫,防失联。半导体行业分析 本篇文章的内容,参考自曦智科技孟怀宇博士的一次演讲,内容非常硬核,有兴趣的朋友可以多关注一 下曦智科技,他们是全球领先的光电混合算力提供商。 在高性能计算领域,超节点的出现为大规模模型的训练与推理提供了全新的解决方案,而光学技术的应 用则成为推动超节点性能提升的关键驱动力。光学技术通过其高效、低延迟和高可靠性的特性,不仅解 决了传统互联方案的瓶颈,还为超节点的架构设计和实际部署带来了革命性的价值。 超节点的诞生源于对大规模模型计算需求的激增,其核心价值在于显著提升训练和推理的效率。在训练 层面,自第三代大模型问世以来,模型规模呈现指数级增长,对GPU算力的需求也随之快速攀升。当前 主流大模型可能需要数千甚至上万张GPU协同工作,而超节点通过高效的互联架构,能够大幅提升训练 效率,尤其是在超大规模模型的场景下,其优势尤为突出。超节点通过优化计算资源分配和数据传输, 减少了训练过程中的瓶颈,使模型训练时间显著缩短。 在推理层面,2025年以来,国内市场对大模型推理的关注度持续升温。推理场景的核心在于如何高效地 生成结 ...