花港架构
搜索文档
摩尔线程,展现最新成果
财联社· 2025-12-20 19:18
国产GPU领军企业摩尔线程(688795.SH)的生态版图正在加速扩张。 12月20日,摩尔线程在北京举办首届"MUSA开发者大会"(MDC 2025), 创始人、董事长兼CEO张建中介绍了公司研发历时五年的核心 成果——新一代全功能GPU架构"花港"。 在长达数小时的主题演讲中,张建中将"全功能"视作摩尔线程的技术底座。 他认为,全功能GPU的创新本质是一部算力进化史,这意味着GPU芯片可以处理大部分的数据单元和格式。 此次发布的"花港"架构采用新 一代指令集,算力密度较上一代提升了50%,能效则提升了10倍,将于明年实现量产。 值得注意的是,"花港"架构实现了从FP4到FP64全精度的支持,并在图形技术上集成了第一代AI生成式渲染架构(AGR)和第二代光线追 踪硬件加速引擎。 基于"花港"架构,摩尔线程同步公布了两款核心芯片规划。 主打AI训推一体、超智融合的"华山"以及专攻高性能图形渲染的"庐山"。 据现场披露的信息,"华山"芯片内置了新一代异步编程模型,具备高效线程同步和线程束特化特性,在张量计算方面,该芯片拥有全精度 MMA,并配备了摩尔线程MTFP8/6/4混合低精度计算技术。 而另一款芯片"庐山 ...
摩尔线程发布“花港”架构,力推国产万卡智算生态
21世纪经济报道· 2025-12-20 17:47
(原标题:摩尔线程发布"花港"架构,力推国产万卡智算生态) 21世纪经济报道记者/彭新 在登陆科创板近半月之际,12月20日,摩尔线程(688795.SH)于北京举办首届MUSA开发者大会。 会上,摩尔线程展示了其基于MUSA统一架构为核心的全栈技术成果,并发布下一代全功能GPU架 构"花港"。 "华山"芯片主要面向AI训推一体与超大规模智能计算,可为智算集群提供算力支撑,张建中称该芯片的 浮点算力、访存带宽、高速互联带宽三个指标的能力介于英伟达量产的Blackwell架构和上一代Hopper 架构之间,而在访存容量指标上优于上述两个架构。 同步发布的"庐山"芯片则侧重于高性能图形渲染,其AI计算性能提升64倍,几何处理性能提升16倍,光 线追踪性能提升50倍,并增强了纹理填充和显存容量。 基于该架构,摩尔线程推出面向AI训推一体的"华山"芯片及高性能图形渲染的"庐山"芯片,并展示 了"夸娥"万卡智算集群技术成果与搭载"长江"SoC芯片的端侧AI产品。 MUSA(Meta-computing Unified System Architecture)为摩尔线程自主研发的"元计算"统一计算架构, 覆盖从芯片架构、 ...
摩尔线程,突发大消息!
中国基金报· 2025-12-20 16:54
【导读】摩尔线程发布新一代 GPU 架构 " 花港 " 等 中国基金报记者 卢鸰 12 月 20 日上午,备受市场关注的摩尔线程首届 MUSA 开发者大会在北京中关村国际创新 中心召开。在此次大会上,摩尔线程展示了以自主 MUSA 统一架构为核心的全栈技术成果, 包括新一代 GPU 架构 " 花港 " 、未来将发布的 " 华山 " 芯片和 " 庐山 " 芯片,以及夸娥 万卡智算集群。 发布新一代 GPU 架构 " 花港 " MUSA 是摩尔线程自主研发的元计算统一计算架构,是其战略基石,覆盖从芯片架构、指令 集、编程模型到软件运行库及驱动程序框架等的全栈技术体系。 基于 MUSA 统一体系,摩尔线程揭晓新一代全功能 GPU 架构 " 花港 " ,该架构在计算密 度、能效、精度支持、互联能力及图形技术等方面实现全面突破,其核心特性包括: 1. 计算性能显著提升:基于新一代指令集,算力密度提升 50% ,能效大幅优化;支持从 FP4 到 FP64 的全精度端到端计算,新增 MTFP6/MTFP4 及混合低精度支持。 2. 异步编程与超大规模互联:集成新一代异步编程模型,优化任务调度与并行机制;通过自 研 MTLi ...
摩尔线程,突发大消息!
中国基金报· 2025-12-20 16:50
12月20日上午,备受市场关注的摩尔线程首届MUSA开发者大会在北京中关村国际创新中心召开。在此 次大会上,摩尔线程展示了以自主MUSA统一架构为核心的全栈技术成果,包括新一代GPU架构"花 港"、未来将发布的"华山"芯片和"庐山"芯片,以及夸娥万卡智算集群。 发布新一代GPU架构"花港" MUSA是摩尔线程自主研发的元计算统一计算架构,是其战略基石,覆盖从芯片架构、指令集、编程模 型到软件运行库及驱动程序框架等的全栈技术体系。 基于MUSA统一体系,摩尔线程揭晓新一代全功能GPU架构"花港",该架构在计算密度、能效、精度支 持、互联能力及图形技术等方面实现全面突破,其核心特性包括: 【导读】摩尔线程发布新一代GPU架构"花港"等 中国基金报记者 卢鸰 1.计算性能显著提升:基于新一代指令集,算力密度提升50%,能效大幅优化;支持从FP4到FP64的全 精度端到端计算,新增MTFP6/MTFP4及混合低精度支持。 2.异步编程与超大规模互联:集成新一代异步编程模型,优化任务调度与并行机制;通过自研MTLink 高速互联技术,支持十万卡以上规模智算集群扩展。 3.图形与AI深度融合:内置AI生成式渲染架构,增强 ...
摩尔线程亮出全栈技术底牌:“花港”新架构与万卡集群冲击高端GPU市场格局
环球网· 2025-12-20 15:00
【环球网科技报道 记者 李文瑶】12月20日,摩尔线程在首届MUSA开发者大会(MDC 2025)上,系统展示了其在全功能GPU领域从架构 创新、集群能力到生态建设的突破。 其中最引人关注的是新一代GPU架构"花港"的亮相,以及可支撑万亿参数模型训练的"夸娥"万卡智算集群的实际效率披露。 架构迭代:"花港"亮相,双芯片路线瞄准AI与图形 大会的核心发布之一是新一代全功能GPU架构"花港"。根据摩尔线程公布的信息,该架构在计算密度上提升50%,效能提升最高达10倍, 并完整支持从FP4到FP64的全精度计算。尤为关键的是,架构层面集成了自研的MTLink高速互联技术,为十万卡规模以上的集群扩展提供 了底层支持。 这一架构与产品路线的发布,标志着摩尔线程不再局限于单一场景的加速卡产品,而是向覆盖AI计算、图形渲染、科学计算等全场景 的"全功能GPU"平台迈进。在业内人士看来,这既是技术能力的体现,也是应对市场多元需求、构建更宽生态护城河的战略选择。 集群能力:万卡训练效率指标首度公开 如果说芯片架构是"点"的突破,那么集群能力则是"面"的验证。本次大会上,摩尔线程首次系统披露了其"夸娥"万卡智算集群的关键工程 效 ...
国产算力迈入“万卡”时代:摩尔线程发布新一代GPU架构,中科曙光发布万卡超集群
经济观察网· 2025-12-20 14:47
行业竞争焦点转移 - 国产算力产业链竞争焦点已从比拼单卡参数转向构建能稳定运行的万卡级系统[2] - 当模型参数量突破万亿,算力提升依赖规模堆叠,核心问题是如何让上万张计算卡协同工作[2] 摩尔线程新产品发布 - 摩尔线程发布最新全功能GPU架构“花港”,新架构算力密度提升50%,效能提升10倍[3] - “花港”架构支持从FP4到FP64的全精度计算,并新增对MTFP6、MTFP4及混合低精度的支持[3] - 基于新架构规划两款芯片:“华山”定位AI训推一体,专攻大规模智算;“庐山”专注高性能图形渲染,其AI计算性能较前代提升64倍,光线追踪性能提升50%[4] - 公司坚持“全功能GPU”技术路线,同时覆盖图形渲染与人工智能计算两个市场[5] 中科曙光万卡集群系统 - 中科曙光发布“scaleX”万卡超集群系统,这是国产万卡级算力集群首次以真机形式公开亮相[6] - 系统由16个scaleX640超节点通过scaleFabric高速网络互连,总计可部署10240块AI加速卡[10] - 系统采用浸没相变液冷技术,单机柜算力密度相比业界提升20倍,PUE值降至1.04[12] 解决通信与散热挑战 - 构建万卡集群需解决散热、供电与物理空间限制等多重物理与工程难题[7][8] - 高功率算力芯片集中部署会产生惊人热量和电力消耗[9] - 摩尔线程在“花港”架构中集成新一代异步编程模型,并通过自研MTLink互联技术宣称支持十万卡以上规模集群扩展[12] - 中科曙光发布scaleFabric网络,基于国内首款400G类InfiniBand的原生RDMA网卡与交换芯片,实现400Gb/s带宽与低于1微秒的端侧通信延迟[12] 大模型推理能力验证 - 随着DeepSeek等国产大模型参数量达671B级别,在国产硬件上跑通这些模型成为硬件厂商的试金石[13] - 摩尔线程展示与硅基流动合作的测试数据:在DeepSeek R1 671B全量模型上,其MTT S5000单卡Prefill吞吐量突破4000 tokens/s,Decode吞吐量突破1000 tokens/s[13] 软件生态与系统兼容性 - 摩尔线程宣布其MUSA统一架构升级至5.0版本,核心计算库muDNN在GEMM与FlashAttention上的效率超过98%[13] - 硬件规格逼近国际主流后,国产厂商研发重心正向软件栈优化转移[13] - 中科曙光scaleX万卡超集群支持多品牌加速卡,并已完成400余个主流大模型的适配优化,采用开放架构策略[14]
摩尔线程推出新一代“花港”架构及芯片路线
中国经营报· 2025-12-20 14:17
摩尔线程的数据显示,华山在浮点算力、访存带宽、访存容量超越某国际厂商已发售的上一代产品;相 比上一代显卡S80,庐山在3A游戏性能表现上有了15倍提升。 (文章来源:中国经营报) 12月20日,在首届MUSA开发者大会(MUSA Developer Conference)上,摩尔线程(688795.SH)创始 人、董事长兼CEO张建中发布了MUSA新架构"花港"及芯片路线图,包括基于"花港"架构的新一代高性 能芯片——华山和庐山。 张建中表示,该架构具备以下性能和特点:支持新一代指令集;算力密度提升50%,能效提升10倍;全 精度端到端加速技术;新一代异步编程模型;支持十万卡以上规模智算集群;第一代AI生成式渲染架 构(AGR)等。 ...
利好来了!摩尔线程,重磅发布!
新浪财经· 2025-12-20 13:27
新一代GPU架构“花港”发布 - 摩尔线程于12月20日在北京举办首届MUSA开发者大会,正式发布新一代GPU架构“花港” [2][9] - “花港”架构采用新一代指令集,算力密度提升50%,能效提升10倍,并支持十万卡以上规模智算集群 [1][2][8][9] - 该架构集成全精度端到端加速技术和新一代异步编程模型,在图形方面拥有第一代AI生成式渲染架构和第二代光线追踪硬件加速引擎 [2][9] - 截至2025年6月30日,支撑该架构的核心技术已获得超500项授权专利,覆盖GPU虚拟化、功耗管理、AI计算加速架构等多个领域 [2][9] 基于新架构的两款芯片 - 公司同步发布基于“花港”架构的两款芯片:“华山”和“庐山” [1][3][8][10] - “华山”芯片主打AI训推一体和超智融合,在浮点算力、访存带宽、容量及高速互联带宽方面均有提升 [3][10] - “华山”芯片具备新一代张量计算引擎,支持TF32/FP16/INT8等全精度MMA,并配备MTFP8/6/4混合低精度计算技术,兼容MXFP和NVFP [3][10] - “庐山”芯片主打高性能图形渲染,同样实现算力密度提升50%和能效提升10倍,内置AI生成式渲染架构与第二代光追引擎,完美支持DirectX 12 Ultimate [3][10] - 搭载“华山”和“庐山”芯片的全新硬件产品预计将在明年亮相 [4][11] 全栈软件与生态升级 - 公司自研的MUSA架构迎来全栈软件升级,完美支持全功能GPU计算生态,拥有完备的软件栈和广泛的生态兼容 [2][9] - 统一软件栈覆盖公司全系列产品,能够计算所有的数据单元和格式 [2][9] AI算力笔记本产品发布 - 公司正式发布AI算力本MTTAIBOOK笔记本,32GB+1TB版本售价9999元,已于京东开放预售,将于2026年1月10日正式开售 [1][5][8][11] - 该笔记本搭载公司自主研发的智能SoC芯片“长江”,集成高性能全大核CPU及全功能GPU,支持MUSA统一架构,异构AI算力达50TOPS [5][11] - 笔记本内置AI智能体和AI数字人,集开发、办公、娱乐于一体,支持Windows虚拟机、Linux、安卓容器及所有国产操作系统 [6][11] - 具体功能包括内置2D数字人“小麦”,支持0.5秒内生成数字人形象;预装Qwen3-8B大模型支持本地数据处理,并可连接云端MUSAChat-72B大模型 [6][12] - 产品采用创新散热设计,配备7752mm²超薄真空腔均热板和双涡轮风扇 [6][12] 行业挑战与公司股价表现 - 公司CEO指出,当前大模型推理仍面临迭代高速化、服务极致化、模型复杂化三大挑战 [7][12] - 公司股价近期持续调整,12月19日跌幅达5.9%,收报664.10元/股,相较于12月11日高点累计跌幅达29.4% [7][12] - 相较于发行价,公司股价仍上涨超481%,总市值报3121.46亿元 [7][12]
利好来了!摩尔线程,重磅发布!
券商中国· 2025-12-20 13:21
"国产GPU第一股"大动作。 今日,摩尔线程正式发布新一代GPU架构"花港"及两款基于该架构的芯片"华山""庐山"。"花港"采用新一代指 令集,算力密度提升50%,能效提升10倍,可支持十万卡以上规模智算集群。 同时,摩尔线程还推出了集成"长江"智能SoC芯片的AI算力本MTTAIBOOK笔记本,32GB+1TB版本售价9999 元,将于2026年1月10日开售。据介绍,该笔记本内置了AI(人工智能)智能体和AI数字人。 摩尔线程重磅发布 12月20日,摩尔线程在北京举办了首届"MUSA开发者大会"(MDC2025),摩尔线程创始人、董事长兼CEO张建 中在主题演讲中宣布,摩尔线程发布新一代GPU架构"花港"。 据介绍,新架构拥有新一代指令集,算力密度提升50%,能效提升10倍,并集成全精度端到端加速技术和新一 代异步编程模型,支持十万卡以上规模智算集群。"花港"在图形上也有突破,拥有全新第一代AI生成式渲染 架构(AGR)和第二代光线追踪硬件加速引擎。 同时,在软件层面,张建中宣布,公司自研MUSA架构迎来全栈软件升级,完美支持全功能GPU计算生态,拥 有完备的软件栈和广泛的生态兼容,统一软件栈覆盖全系列产 ...
摩尔线程庐山芯片发布:3A游戏性能提升15倍
新浪财经· 2025-12-20 11:36
格隆汇12月20日|在今日举办的摩尔线程2025MUSA开发者大会上,除了"花港"新架构和华山芯片之外,摩尔线程 还带来了图形芯片——庐山。庐山是基于花港架构打造的高性能图形渲染芯片,将实现3A游戏渲染15倍的提升, 光线追踪性能提升50倍,原子访存性能提升了8倍,显存容量提升了4倍。AI渲染性能提升了64倍,几何处理性能 提升了16倍,纹理填充性能提升了4倍。除支持游戏体验外,还支持所有CAD、CAE等图形设计渲染。 ...