Workflow
华山芯片
icon
搜索文档
效能提升10倍!摩尔线程新一代全功能GPU架构“花港”正式发布
北京商报· 2025-12-20 18:42
从其核心特性来看,一是计算性能显著提升,基于新一代指令集,算力密度提升50%,能效大幅优化; 支持从FP4到FP64的全精度端到端计算,新增MTFP6/MTFP4及混合低精度支持。二是异步编程与超大 规模互联,集成新一代异步编程模型,优化任务调度与并行机制;通过自研MTLink高速互联技术,支 持十万卡以上规模智算集群扩展。三是图形与AI深度融合,内置AI生成式渲染架构,增强硬件光线追 踪加速引擎,完整支持DirectX 12 Ultimate,实现图形渲染与智能计算的高度协同。四是全栈自研、安 全可信。张建中在本次大会上表示,未来,公司将基于该架构推出高性能AI训推一体"华山"芯片与专攻 高性能图形渲染的"庐山"芯片。 在本次大会上,摩尔线程还发布了夸娥万卡智算集群。据介绍,该集群具备全精度、全功能通用计算能 力,在万卡规模下实现高效稳定的AI训练与推理。此外,公司还正式发布搭载智能SoC芯片"长江"的AI 算力本MTT AIBOOK,等等。 在主题演讲中,张建中表示:"生态体系是GPU行业的核心护城河与价值所在,依托MUSA架构的优 势,摩尔线程持续加大研发投入,致力于攻克从硬件到软件的核心技术挑战,以开 ...
摩尔线程发布“花港”架构,力推国产万卡智算生态
21世纪经济报道· 2025-12-20 17:47
(原标题:摩尔线程发布"花港"架构,力推国产万卡智算生态) 21世纪经济报道记者/彭新 在登陆科创板近半月之际,12月20日,摩尔线程(688795.SH)于北京举办首届MUSA开发者大会。 会上,摩尔线程展示了其基于MUSA统一架构为核心的全栈技术成果,并发布下一代全功能GPU架 构"花港"。 "华山"芯片主要面向AI训推一体与超大规模智能计算,可为智算集群提供算力支撑,张建中称该芯片的 浮点算力、访存带宽、高速互联带宽三个指标的能力介于英伟达量产的Blackwell架构和上一代Hopper 架构之间,而在访存容量指标上优于上述两个架构。 同步发布的"庐山"芯片则侧重于高性能图形渲染,其AI计算性能提升64倍,几何处理性能提升16倍,光 线追踪性能提升50倍,并增强了纹理填充和显存容量。 基于该架构,摩尔线程推出面向AI训推一体的"华山"芯片及高性能图形渲染的"庐山"芯片,并展示 了"夸娥"万卡智算集群技术成果与搭载"长江"SoC芯片的端侧AI产品。 MUSA(Meta-computing Unified System Architecture)为摩尔线程自主研发的"元计算"统一计算架构, 覆盖从芯片架构、 ...
摩尔线程,突发大消息!
中国基金报· 2025-12-20 16:54
【导读】摩尔线程发布新一代 GPU 架构 " 花港 " 等 中国基金报记者 卢鸰 12 月 20 日上午,备受市场关注的摩尔线程首届 MUSA 开发者大会在北京中关村国际创新 中心召开。在此次大会上,摩尔线程展示了以自主 MUSA 统一架构为核心的全栈技术成果, 包括新一代 GPU 架构 " 花港 " 、未来将发布的 " 华山 " 芯片和 " 庐山 " 芯片,以及夸娥 万卡智算集群。 发布新一代 GPU 架构 " 花港 " MUSA 是摩尔线程自主研发的元计算统一计算架构,是其战略基石,覆盖从芯片架构、指令 集、编程模型到软件运行库及驱动程序框架等的全栈技术体系。 基于 MUSA 统一体系,摩尔线程揭晓新一代全功能 GPU 架构 " 花港 " ,该架构在计算密 度、能效、精度支持、互联能力及图形技术等方面实现全面突破,其核心特性包括: 1. 计算性能显著提升:基于新一代指令集,算力密度提升 50% ,能效大幅优化;支持从 FP4 到 FP64 的全精度端到端计算,新增 MTFP6/MTFP4 及混合低精度支持。 2. 异步编程与超大规模互联:集成新一代异步编程模型,优化任务调度与并行机制;通过自 研 MTLi ...
摩尔线程,突发大消息!
中国基金报· 2025-12-20 16:50
12月20日上午,备受市场关注的摩尔线程首届MUSA开发者大会在北京中关村国际创新中心召开。在此 次大会上,摩尔线程展示了以自主MUSA统一架构为核心的全栈技术成果,包括新一代GPU架构"花 港"、未来将发布的"华山"芯片和"庐山"芯片,以及夸娥万卡智算集群。 发布新一代GPU架构"花港" MUSA是摩尔线程自主研发的元计算统一计算架构,是其战略基石,覆盖从芯片架构、指令集、编程模 型到软件运行库及驱动程序框架等的全栈技术体系。 基于MUSA统一体系,摩尔线程揭晓新一代全功能GPU架构"花港",该架构在计算密度、能效、精度支 持、互联能力及图形技术等方面实现全面突破,其核心特性包括: 【导读】摩尔线程发布新一代GPU架构"花港"等 中国基金报记者 卢鸰 1.计算性能显著提升:基于新一代指令集,算力密度提升50%,能效大幅优化;支持从FP4到FP64的全 精度端到端计算,新增MTFP6/MTFP4及混合低精度支持。 2.异步编程与超大规模互联:集成新一代异步编程模型,优化任务调度与并行机制;通过自研MTLink 高速互联技术,支持十万卡以上规模智算集群扩展。 3.图形与AI深度融合:内置AI生成式渲染架构,增强 ...
摩尔线程,重大发布!
证券时报· 2025-12-20 15:54
摩尔线程最新发布。 12月20日,摩尔线程董事长兼CEO张建中在摩尔线程首届MUSA开发者大会上发布新一代GPU架构——"花港"。据介绍,"花港"基于新一代指令集,算力 密度提升50%,能效提升10倍,可支持十万卡以上规模智算集群。 此前,摩尔线程曾发布预告称,12月20日至21日,摩尔线程首届MUSA开发者大会(MUSA Developer Conference)将在北京中关村国际创新中心举办。 张建中将首次系统阐述以MUSA(Meta-computing Unified System Architecture)为核心的全栈发展战略与未来愿景,并重磅发布新一代GPU架构、推出涵 盖产品体系、核心技术及行业解决方案的完整布局,分享多领域落地案例与生态建设进展。 摩尔线程还分享了其图形进化与前沿探索:实现硬件级光线追踪加速与自研AI生成式渲染技术,具身智能、科学智能(AI4S)、AI for 6G等前沿领域的 深度布局。 摩尔线程主要从事GPU及相关产品的研发、设计和销售,被市场视为"中国版英伟达"。12月5日,摩尔线程顶着"国产GPU第一股"称号登陆A股市场,上市 首日就大涨超400%,此后股价更是一路上涨, ...
摩尔线程,重大发布!
证券时报· 2025-12-20 15:50
核心观点 - 摩尔线程在首届MUSA开发者大会上发布了新一代GPU架构“花港”及一系列技术与产品进展,展示了其在AI计算、图形渲染、智算集群及终端硬件等领域的全栈布局与生态建设 [2][3][6] 架构与产品发布 - 发布新一代全功能GPU架构“花港”,基于新一代指令集,算力密度提升50%,能效提升10倍,可支持十万卡以上规模智算集群 [2][3] - “花港”架构支持从FP4到FP64的全精度计算,公司计划基于该架构推出高性能AI训推一体“华山”芯片与专攻高性能图形渲染的“庐山”芯片 [3] - 公司GPU架构快速迭代,MUSA架构已从2022年的“苏堤”、2023年的“春晓”、2024年的“曲院”进化到2025年的“平湖” [3] - 全功能GPU包含四大功能引擎:AI计算加速引擎、图形渲染引擎、物理仿真和科学计算引擎、超高清视频编解码引擎 [2] - MUSA是支撑这些引擎的系统架构,类似于英伟达的CUDA [2] 智算集群与硬件产品 - 发布“夸娥”万卡智算集群 [3] - 分享面向下一代超大规模智算中心的MTT C256超节点架构规划 [3] - 发布AI算力本MTT AIBOOK,搭载智能SoC芯片“长江”,32GB、1TB版本预售价9999元,将于2026年1月10日正式开售 [3] 技术前沿与生态布局 - 在图形技术方面实现硬件级光线追踪加速与自研AI生成式渲染技术 [6] - 在具身智能、科学智能(AI4S)、AI for 6G等前沿领域进行深度布局 [6] - 公司被视为“中国版英伟达”,并于2024年12月5日以“国产GPU第一股”身份登陆A股 [6] 市场表现与财务数据 - 上市首日股价大涨超400%,此后一度突破940元/股,近期股价回调至664.1元/股 [6] - 2025年1—9月,公司营业收入为7.85亿元,归属于母公司所有者的净利润为-7.24亿元 [8] - 公司预计2025年全年归属于母公司股东的净利润为-11.68亿元至-7.30亿元 [8]
摩尔线程公布新GPU架构和万卡集群
观察者网· 2025-12-20 15:27
12月20日上午,刚刚登陆科创板的GPU新秀摩尔线程,召开了首届MUSA开发者大会(MDC 2025)。 会上,摩尔线程公布了新一代GPU架构"花港",AI训推一体芯片"华山",用于游戏和图形渲染等场景的 芯片"庐山",以及"夸娥"万卡训练集群等产品。 现场,中国工程院院士、清华大学计算机系教授郑纬民发表主题演讲。他指出,发展"主权AI"是提升未 来国家竞争力的关键,其核心在于实现"算力自主、算法自强、生态自立"的完整体系。 霸狂女 为什么 "万卡甚至十万卡系统"是必选项 算力基石 模型时代的基本单位是集群总算力,不是单卡性能 预训练超大规模模型、服务国民级推理需求,需要 持续可用的万卡级训练集群 分布在全国的推理集群与第力网络 num SSICAL Partist 从主权 Al 角度 国产万卡/十万卡系统 = 本土大模型与行业模型的 "母机"与基座 图 郑纬民认为,国产计算显卡与国外主流产品的性能差距正在持续缩小,虽然构建国产万卡乃至十万卡级 别的超大规模智算系统存在难度,但这是必须完成的产业基础设施任务。他特别指出,开发者是生态建 设的关键,国产芯片平台必须构建起友好、易用的开发环境,以有效服务开发者社群 ...
国产算力迈入“万卡”时代:摩尔线程发布新一代GPU架构,中科曙光发布万卡超集群
经济观察网· 2025-12-20 14:47
行业竞争焦点转移 - 国产算力产业链竞争焦点已从比拼单卡参数转向构建能稳定运行的万卡级系统[2] - 当模型参数量突破万亿,算力提升依赖规模堆叠,核心问题是如何让上万张计算卡协同工作[2] 摩尔线程新产品发布 - 摩尔线程发布最新全功能GPU架构“花港”,新架构算力密度提升50%,效能提升10倍[3] - “花港”架构支持从FP4到FP64的全精度计算,并新增对MTFP6、MTFP4及混合低精度的支持[3] - 基于新架构规划两款芯片:“华山”定位AI训推一体,专攻大规模智算;“庐山”专注高性能图形渲染,其AI计算性能较前代提升64倍,光线追踪性能提升50%[4] - 公司坚持“全功能GPU”技术路线,同时覆盖图形渲染与人工智能计算两个市场[5] 中科曙光万卡集群系统 - 中科曙光发布“scaleX”万卡超集群系统,这是国产万卡级算力集群首次以真机形式公开亮相[6] - 系统由16个scaleX640超节点通过scaleFabric高速网络互连,总计可部署10240块AI加速卡[10] - 系统采用浸没相变液冷技术,单机柜算力密度相比业界提升20倍,PUE值降至1.04[12] 解决通信与散热挑战 - 构建万卡集群需解决散热、供电与物理空间限制等多重物理与工程难题[7][8] - 高功率算力芯片集中部署会产生惊人热量和电力消耗[9] - 摩尔线程在“花港”架构中集成新一代异步编程模型,并通过自研MTLink互联技术宣称支持十万卡以上规模集群扩展[12] - 中科曙光发布scaleFabric网络,基于国内首款400G类InfiniBand的原生RDMA网卡与交换芯片,实现400Gb/s带宽与低于1微秒的端侧通信延迟[12] 大模型推理能力验证 - 随着DeepSeek等国产大模型参数量达671B级别,在国产硬件上跑通这些模型成为硬件厂商的试金石[13] - 摩尔线程展示与硅基流动合作的测试数据:在DeepSeek R1 671B全量模型上,其MTT S5000单卡Prefill吞吐量突破4000 tokens/s,Decode吞吐量突破1000 tokens/s[13] 软件生态与系统兼容性 - 摩尔线程宣布其MUSA统一架构升级至5.0版本,核心计算库muDNN在GEMM与FlashAttention上的效率超过98%[13] - 硬件规格逼近国际主流后,国产厂商研发重心正向软件栈优化转移[13] - 中科曙光scaleX万卡超集群支持多品牌加速卡,并已完成400余个主流大模型的适配优化,采用开放架构策略[14]
摩尔线程推出新一代“花港”架构及芯片路线
中国经营报· 2025-12-20 14:17
摩尔线程的数据显示,华山在浮点算力、访存带宽、访存容量超越某国际厂商已发售的上一代产品;相 比上一代显卡S80,庐山在3A游戏性能表现上有了15倍提升。 (文章来源:中国经营报) 12月20日,在首届MUSA开发者大会(MUSA Developer Conference)上,摩尔线程(688795.SH)创始 人、董事长兼CEO张建中发布了MUSA新架构"花港"及芯片路线图,包括基于"花港"架构的新一代高性 能芯片——华山和庐山。 张建中表示,该架构具备以下性能和特点:支持新一代指令集;算力密度提升50%,能效提升10倍;全 精度端到端加速技术;新一代异步编程模型;支持十万卡以上规模智算集群;第一代AI生成式渲染架 构(AGR)等。 ...
利好来了!摩尔线程,重磅发布!
新浪财经· 2025-12-20 13:27
新一代GPU架构“花港”发布 - 摩尔线程于12月20日在北京举办首届MUSA开发者大会,正式发布新一代GPU架构“花港” [2][9] - “花港”架构采用新一代指令集,算力密度提升50%,能效提升10倍,并支持十万卡以上规模智算集群 [1][2][8][9] - 该架构集成全精度端到端加速技术和新一代异步编程模型,在图形方面拥有第一代AI生成式渲染架构和第二代光线追踪硬件加速引擎 [2][9] - 截至2025年6月30日,支撑该架构的核心技术已获得超500项授权专利,覆盖GPU虚拟化、功耗管理、AI计算加速架构等多个领域 [2][9] 基于新架构的两款芯片 - 公司同步发布基于“花港”架构的两款芯片:“华山”和“庐山” [1][3][8][10] - “华山”芯片主打AI训推一体和超智融合,在浮点算力、访存带宽、容量及高速互联带宽方面均有提升 [3][10] - “华山”芯片具备新一代张量计算引擎,支持TF32/FP16/INT8等全精度MMA,并配备MTFP8/6/4混合低精度计算技术,兼容MXFP和NVFP [3][10] - “庐山”芯片主打高性能图形渲染,同样实现算力密度提升50%和能效提升10倍,内置AI生成式渲染架构与第二代光追引擎,完美支持DirectX 12 Ultimate [3][10] - 搭载“华山”和“庐山”芯片的全新硬件产品预计将在明年亮相 [4][11] 全栈软件与生态升级 - 公司自研的MUSA架构迎来全栈软件升级,完美支持全功能GPU计算生态,拥有完备的软件栈和广泛的生态兼容 [2][9] - 统一软件栈覆盖公司全系列产品,能够计算所有的数据单元和格式 [2][9] AI算力笔记本产品发布 - 公司正式发布AI算力本MTTAIBOOK笔记本,32GB+1TB版本售价9999元,已于京东开放预售,将于2026年1月10日正式开售 [1][5][8][11] - 该笔记本搭载公司自主研发的智能SoC芯片“长江”,集成高性能全大核CPU及全功能GPU,支持MUSA统一架构,异构AI算力达50TOPS [5][11] - 笔记本内置AI智能体和AI数字人,集开发、办公、娱乐于一体,支持Windows虚拟机、Linux、安卓容器及所有国产操作系统 [6][11] - 具体功能包括内置2D数字人“小麦”,支持0.5秒内生成数字人形象;预装Qwen3-8B大模型支持本地数据处理,并可连接云端MUSAChat-72B大模型 [6][12] - 产品采用创新散热设计,配备7752mm²超薄真空腔均热板和双涡轮风扇 [6][12] 行业挑战与公司股价表现 - 公司CEO指出,当前大模型推理仍面临迭代高速化、服务极致化、模型复杂化三大挑战 [7][12] - 公司股价近期持续调整,12月19日跌幅达5.9%,收报664.10元/股,相较于12月11日高点累计跌幅达29.4% [7][12] - 相较于发行价,公司股价仍上涨超481%,总市值报3121.46亿元 [7][12]