Workflow
国产算力
icon
搜索文档
国产算力迈入“万卡”时代:摩尔线程发布新一代GPU架构,中科曙光发布万卡超集群
经济观察网· 2025-12-20 14:47
行业竞争焦点转移 - 国产算力产业链竞争焦点已从比拼单卡参数转向构建能稳定运行的万卡级系统[2] - 当模型参数量突破万亿,算力提升依赖规模堆叠,核心问题是如何让上万张计算卡协同工作[2] 摩尔线程新产品发布 - 摩尔线程发布最新全功能GPU架构“花港”,新架构算力密度提升50%,效能提升10倍[3] - “花港”架构支持从FP4到FP64的全精度计算,并新增对MTFP6、MTFP4及混合低精度的支持[3] - 基于新架构规划两款芯片:“华山”定位AI训推一体,专攻大规模智算;“庐山”专注高性能图形渲染,其AI计算性能较前代提升64倍,光线追踪性能提升50%[4] - 公司坚持“全功能GPU”技术路线,同时覆盖图形渲染与人工智能计算两个市场[5] 中科曙光万卡集群系统 - 中科曙光发布“scaleX”万卡超集群系统,这是国产万卡级算力集群首次以真机形式公开亮相[6] - 系统由16个scaleX640超节点通过scaleFabric高速网络互连,总计可部署10240块AI加速卡[10] - 系统采用浸没相变液冷技术,单机柜算力密度相比业界提升20倍,PUE值降至1.04[12] 解决通信与散热挑战 - 构建万卡集群需解决散热、供电与物理空间限制等多重物理与工程难题[7][8] - 高功率算力芯片集中部署会产生惊人热量和电力消耗[9] - 摩尔线程在“花港”架构中集成新一代异步编程模型,并通过自研MTLink互联技术宣称支持十万卡以上规模集群扩展[12] - 中科曙光发布scaleFabric网络,基于国内首款400G类InfiniBand的原生RDMA网卡与交换芯片,实现400Gb/s带宽与低于1微秒的端侧通信延迟[12] 大模型推理能力验证 - 随着DeepSeek等国产大模型参数量达671B级别,在国产硬件上跑通这些模型成为硬件厂商的试金石[13] - 摩尔线程展示与硅基流动合作的测试数据:在DeepSeek R1 671B全量模型上,其MTT S5000单卡Prefill吞吐量突破4000 tokens/s,Decode吞吐量突破1000 tokens/s[13] 软件生态与系统兼容性 - 摩尔线程宣布其MUSA统一架构升级至5.0版本,核心计算库muDNN在GEMM与FlashAttention上的效率超过98%[13] - 硬件规格逼近国际主流后,国产厂商研发重心正向软件栈优化转移[13] - 中科曙光scaleX万卡超集群支持多品牌加速卡,并已完成400余个主流大模型的适配优化,采用开放架构策略[14]
国产算力的开放时刻:超节点迈入万卡纪元
傅里叶的猫· 2025-12-19 18:11
日前,在昆山的人工智能创新大会(HAIC 2025)上,中科曙光展示了首个国产万卡级AI超集群——scaleX 万卡超节点真机。这是中国AI算力史上的一 个标志性时刻,超节点真正意义上迈入万卡纪元。 Scale X万卡超级群的落地,不仅是一次超节点技术的权利交接,更是中国AI算力基础设施在发展路径上给出的新答案。 超节点之始 三年前,国内的 AI 算力体系基本都得靠英伟达,不管是 GPU 加速卡、NVLink 高速互联技术,还是 CUDA 软件栈,都是NV的东西。这套方案几乎成 了行业默认标准,也让整个产业链对这一家供应商的依赖越来越明显。 其中,发布时间相对较早的浪潮 "元脑 SD200" 和阿里 "磐久 128",共同搭建起了国产开放架构体系的雏形。浪潮这款产品主打多品牌 GPU 异构计算, 还创下了 8.9 毫秒生成 token 的亮眼纪录;阿里的产品则依靠开放协议整合不同互联标准,成功搭建出 "云端超节点"。 而中科曙光在 HAIC 大会上推出的 scaleX 万卡超节点真机,也是备受关注。这套系统由 16 个 scaleX640 超节点互联组成,总共部署了 10240 张 AI 加速 卡,总算力突破 ...
开源证券:谷歌(GOOGL.US)AI生态持续完善 坚定看好“光、液冷、国产算力”三条核心主线
智通财经网· 2025-12-19 09:28
谷歌AI生态持续完善,海外TPU等ASIC有望加速放量 谷歌AI模型表现亮眼,加速对自研芯片及集群方案的演进,有望带来更多液冷增量需求。2025年12月 18日,据路透社消息,谷歌正在推动TPU与PyTorch的完全兼容,有望大幅降低企业迁移成本,适用更 多开发者,加速开拓市场。4月9日,谷歌发布TPUv7 Ironwood,单芯片达到4614 TeraFlops,内存容量 为192GB,带宽高达7.2 Tbps,单集群可扩展至9216个芯片,采用液冷解决方案。11月19日,谷歌发布 Gemini 3系列模型,包含两个核心版本:面向日常应用的Pro预览版和专注深度推理的Deep Think模式, 整合了推理能力、多模态理解和智能体能力三大核心能力,在多个测试基准中表现亮眼。该行认为 Gemini 3的发布标志着谷歌在AI应用领域的重要突破,不仅在技术性能上实现代际提升,更丰富了应用 生态和加速商业模式闭环,未来有望加速TPU集群部署。 智通财经APP获悉,开源证券发布研报称,谷歌(GOOGL.US)AI模型表现亮眼,加速自研芯片及集群方 案演进,带来液冷增量需求。TPU与PyTorch兼容性增强,降低迁移成本 ...
云天励飞罗忆:推理超越训练,国产算力的真正战场在生态与成本丨GAIR 2025
雷峰网· 2025-12-18 08:45
在人工智能逐步成为国家竞争核心变量的当下,算力正以前所未有的速度重塑技术路径与产业结构。13日 举办的「AI 算力新十年」专场聚焦智能体系的底层核心——算力,从架构演进、生态构建到产业化落地展 开系统讨论,试图为未来十年的中国AI产业,厘清关键变量与发展方向。 GAIR 2025「AI 算力新十年」 专场上,云天励飞副总裁罗忆发表了题为 《芯智AI筑基,普惠点亮未来》 的主题演讲,系统阐述了他对国产芯片路径和AI普惠化的核心判断。 当大多数人还在讨论人工智能"是否有用"的2014年,一家中国公司已经选择了一条更难、也更远的路 —— 同时押注算法与芯片,试图从底层构建属于自己的AI技术体系 。此后十余年,从深度学习的早期探 索,到大模型席卷全球,再到算力成为国家级命题,这家公司几乎完整经历了中国人工智能产业从萌芽、 加速到分化竞争的全过程。 某种意义上,云天励飞本身,就是一段中国AI产业的微观缩影。 云天励飞副总裁罗忆,正是这段历程的重要参与者与推动者之一。早年,他需要一次次向客户和产业界解 释"人工智能究竟能解决什么问题";而今天,在推理成本、算力结构与生态壁垒成为行业核心议题的背景 下,他思考的重心,已转向 ...
GPT-5.2发布,持续关注端侧AI
东方财富证券· 2025-12-17 21:11
行业投资评级 - 报告对电子行业维持“强于大市”评级 [2] 核心观点 - 报告核心观点是预期AI推理将主导创新,看好由推理需求驱动的运营支出(Opex)相关方向,主要包括:存储、电力、ASIC和超节点 [2][27] - 报告同时建议关注国产化及端侧AI产品迭代带来的产业链机会 [5][29][30] 本周行情回顾 - 本周(2025年12月8日至12日)沪深300指数下跌0.08%,上证指数下跌0.34%,深证成指上涨0.84%,创业板指上涨2.74% [1][11] - 申万电子指数本周上涨2.63%,在31个申万一级行业中涨幅排名第3 [1][11] - 年初以来,申万电子指数累计上涨45.9%,涨幅排名同样为第3/31 [1][11] - 细分板块层面,电子化学品、元件、其他电子、半导体和消费电子本周分别上涨6.99%、6.08%、5.6%、2.68%和0.37%;光学光电子下跌0.22% [17] - 个股层面,本周申万电子行业243家公司上涨,232家下跌,涨幅前五为富信科技(+45.57%)、东田微(+35.90%)、赛微电子(+29.37%)、鸿日达(+27.93%)、立昂微(+26.84%) [19][22] - 截至2025年12月12日,电子行业估值水平(PE-TTM)为59.28倍,处于历史中部水平 [20] 本周关注事件 - **海光信息终止换股吸收合并中科曙光**:海光信息与中科曙光于2025年12月9日分别召开董事会,审议通过终止本次重大资产重组事项,主要原因为市场环境发生较大变化,重组条件尚不成熟,但双方表示终止不影响后续持续合作 [23] - **GPT-5.2发布**:OpenAI于2025年12月11日发布最新AI模型GPT-5.2,该模型针对专业工作场景优化,在多个基准测试中创下行业记录,并已上线ChatGPT付费套餐及开放API [24][25][26] 投资方向与关注领域 存储 - 随着长江存储新产品和长鑫的HBM3等产品逐渐突破,叠加数据中心对SSD及HBM需求快速提升导致供需错配,激发国产存储厂商扩产动能,判断明年有望是“两存”扩产大年 [2][27] - 建议关注国产存力产业链整体机会,包括: - NAND&DRAM半导体(长存相关)产业链:中微公司、拓荆科技、安集科技、京仪装备、中科飞测、微导纳米 [4][27] - 长鑫&HBM存储芯片相关产业链:北方华创、兆易创新、精智达、汇成股份 [4][27] - 存储原厂:美光、海力士、三星、闪迪、兆易创新、聚辰股份等 [4][27] 电力 - 看好电力产业链产品,重点关注用电侧和发电侧的新技术 [2][28] - 相关公司: - 发电侧:三环集团 [4][28] - 用电侧:中富电路、顺络电子、东方钽业、英诺赛科、华峰测控 [4][28] ASIC - 看好ASIC推理全栈模式,预期未来ASIC份额将提升,建议关注国内外主要CSP厂商 [2][28] - 相关公司: - ASIC芯片:博通集成、寒武纪、芯原股份 [4][28] - 配套:沪电股份、福晶科技 [4][28] 超节点 - 预计未来机柜模式会迭代,看好高速互联、机柜代工、液冷散热、PCB等需求增长 [2][29] - 相关公司: - 高速互联:澜起科技、万通发展、盛科通信 [2][29] - 机柜代工:工业富联 [2][29] - 液冷散热:中石科技、捷邦科技等 [5][29] - PCB:生益科技、菲利华、东材科技、鼎泰高科、大族数控、芯碁微装等 [5][29] 国产化方向 - 供给侧:国内先进制程良率及产能爬升,推动国产算力芯片供给侧将有较大幅度改善 [5][29] - 需求侧:国内CSP厂商商业化模式逐渐明朗,AI相关资本开支持续向上,国内模型持续迭代,有望带动国产算力在训练侧的放量需求 [5][29] - 建议重点关注国产算力产业链整体机会,包括: - 先进工艺制造:中芯国际(港股)、华虹半导体(港股)、燕东微 [6][29] - 国产算力龙头:寒武纪、海光信息、芯原股份 [6][29] - 先进封装:通富微电、长电科技、甬矽电子、长川科技、金海通等 [6][29] - 先进设备:北方华创、拓荆科技、微导纳米 [6][29] 端侧AI - 豆包AI手机开售,看好2026年端侧产品迭代 [5][30] - 相关公司: - 果链:苹果、立讯精密、蓝思科技 [6][30] - SOC:瑞芯微、恒玄科技、晶晨股份 [6][30] - AI眼镜:歌尔股份、水晶光电 [6][30] - 其他:中兴通讯、传音控股、豪威集团 [6][30]
暴涨超690%!今日上市!它刷屏了
北京日报客户端· 2025-12-17 16:55
根据招股说明书,沐曦股份本次募集资金将重点投向新型高性能通用GPU研发及产业化等项目,目前公 司的产品应用部署于10余个智算集群,算力网络覆盖国家人工智能公共算力平台、运营商智算平台和商 业化智算中心。 转自:北京日报客户端 今天,国产GPU芯片龙头沐曦股份在上交所科创板上市,发行价格为104.66元/股,截至收盘,公司股 价报829.9元,上涨692.95%,市值达3320亿元。沐曦股份的上市对国内人工智能行业发展将带来哪些影 响? 国产GPU芯片龙头沐曦股份今日上市 总台央视记者 平凡:今天,沐曦股份登陆上交所科创板,它也是国内GPU芯片和计算平台的提供商, 它的上市将加快国内人工智能基础设施建设。截至目前,国产算力公司包括寒武纪、摩尔线程和沐曦股 份,总市值已经突破万亿元。 沐曦股份高级副总裁 孙国梁:我们是作为国产算力底座的核心供应商这个角色进入到资本市场的。我 们还是要认真花好每一分钱,用在底层的核心技术、核心产品、核心生态的打造。 国产算力进入市场之后,也将带动相关的上下游生态体系,包括芯片制造、操作系统、通用和行业模 型、智能体等核心领域。 专家表示,国内通用大模型和各个行业的垂直模型加快升级和 ...
AI应用加速落地赋能千行百业 国产算力技术快速迭代舞台广阔
央视网· 2025-12-17 15:30
在上海电影制片厂,国内首部超百分钟生成式人工智能拟真人剧集近日上线,制作周期算短了三分之二,成本大幅降低。项目背后的支撑就是 影视专属算力池,满足实时渲染、文生视频、虚拟拍摄等多样化需求。 上海电影技术厂有限公司副总经理郗岳介绍,预计到2026年,可以实现百部以上的AIGC(生成式人工智能)项目规模化制作。对国产算力, 以及国产算力相关产业生态提出更高需求。 央视网消息:记者了解到,人工智能在制造业、金融、能源、医疗健康等领域的应用加速落地,这对国产算力相关产业链又将带来哪些机会? 在复旦大学医学院,基于医生、患者和科研等场景的垂直模型和智能体正在开发落地当中,实现医生有AI智能体助手,患者有AI健康顾问。 复旦大学医学院副院长朱同玉介绍,对医生来说是他的一个"大脑",也是他的"助手"。随时可以给患者提供一些健康服务。而每一个疾病在不 同人群也需要一个小模型,它有无限的想象空间。 在TCL的工厂,显示面板生产线部署垂域大模型,通过智能体实现全域自主监控、分析与决策,相关AI应用创造综合效益超过10亿元。 TCL创始人、董事长李东生表示,把AI的应用在先进制造业,能够实实在在创造出效果。他们一直在积极推动和国内 ...
国产算力破局“一芯一策”,跨架构技术打开增长空间!科创50ETF(588000)成交额达29.95亿,持仓股生益电子大涨13.25%!
每日经济新闻· 2025-12-17 14:52
市场表现与资金流向 - 12月17日午后A股三大指数集体拉升 科创50ETF同步上涨 涨幅扩大至2.42% [1] - 科创50ETF成交活跃 截至发文成交额达29.95亿元 [1] - 科创50ETF近期持续获资金青睐 近三日资金净流入9.86亿元 近五日资金净流入17.88亿元 [1] 领涨个股与板块 - 盘面上科技股表现突出 生益电子大涨13.25% 晶合集成上涨8.84% 华润微上涨5.89% 海光信息涨超5% [1] - 科创50指数持仓高度集中于电子与计算机行业 电子行业占比69.39% 计算机行业占比4.88% 合计74.27% [2] - 指数成分涉及半导体 医疗器械 软件开发 光伏设备等多个硬科技细分领域 [2] 行业催化剂与技术进步 - 消息面上 中国电信研究院联合产业伙伴成功完成业界首个面向国产算力的跨架构大模型推理技术验证 [1] - 通过自研Triton跨架构编译器与统一大模型算子库 实现了同一套算子源码在英伟达 昇腾 沐曦三类芯片上无缝运行 [1] - 该技术实现了性能与适配效率的双重优化 [1] 行业前景展望 - 西部证券指出 AI算力高景气将持续驱动通信行业2026年结构性机会 [1] - AI大模型进化与应用渗透带动算力投入高增 产业链多环节供不应求 需求结构向推理端迁移 [1] - 二线云厂商入局与国产算力崛起成为新看点 [1] - 低轨卫星互联网进入景气周期 与AI算力形成协同 共同打开行业增长空间 [1] - 科创50指数与人工智能 机器人等前沿产业发展方向高度契合 [2]
单签赚30万,沐曦股份上市引爆资本狂欢
搜狐财经· 2025-12-17 11:54
AMD系创业天团,五年铸就超级IPO 2025 年 12 月 17 日,国产高性能 GPU 领军企业沐曦集成电路(上海)股份有限公司(股票代码: 688802.SH)正式登陆科创板。发行价 104.66 元 / 股的沐曦股份,开盘即暴涨 568%,股价冲至 700 元 高位,市值瞬间突破 3000 亿元,成为年内最赚钱新股 —— 中一签(500 股)投资者浮盈超 29.7 万元, 刷新 A 股 "肉签" 纪录。 这是科创板短短半个月内诞生的第二家千亿市值 GPU 企业。此前,摩尔线程于 12 月 5 日上市后市值一 度突破 4400 亿元,两家企业接连引爆资本市场,标志着国产算力赛道进入资本化加速期。 沐曦的崛起离不开其硬核创始团队。掌舵者陈维良毕业于电子科技大学与清华大学,拥有超威半导体 (AMD)十余年任职经历,曾任高级总监。2020 年,他联合两位 AMD 前企业院士彭莉、杨建共同创 立沐曦,核心团队成员多来自 AMD,形成技术壁垒深厚的 "老兵创业团"。 "Meta 代表起源,X 象征未来",陈维良赋予公司英文名 "MetaX" 深刻寓意。这支团队仅用两年就完成 首款芯片曦思 N100 流片,核心产品 ...
三芯透明迁移,跨架构大模型推理技术验证完成
选股宝· 2025-12-16 23:17
公司方面,据中证报表示,A股相关概念股拓斯达 、梦网科技等。 *免责声明:文章内容仅供参考,不构成投资建议 *风险提示:股市有风险,入市需谨慎 据中证报报道,近日,中国电信研究院联合中科院计算所、华为昇腾、沐曦等产业伙伴,依托中国电信 云网融合技术中试验证平台,成功完成业界首个面向国产算力的跨架构大模型推理技术验证。此次突破 构建了基于Triton的异构大模型推理框架,实现"一套框架代码、三芯透明迁移"的核心目标,将大模型 算子适配周期从"周级"压缩至"天级",性能达到原生算子库90%。 中证报指出,模化商用的关键瓶颈。该技术实现同一套算子源码在英伟达、昇腾、沐曦三类芯片上无缝 运行,从根源上解决多架构适配难题,为业务方提供直观、精准的选芯决策支撑。未来,通过技术创新 推动国产算力从"可用"向"好用""易用"跨越,为自主可控、多元异构的算力基础设施高质量协同发展注 入强劲动力,助力我国数字经济核心产业自主化进程。 ...