Workflow
摩尔线程(688795)
icon
搜索文档
举办首届MUSA开发者大会 摩尔线程现场展示落地成果
21世纪经济报道· 2025-12-20 21:39
公司技术成果与产品发布 - 公司于12月20日在北京举办首届MUSA开发者大会,展示了其基于MUSA统一架构为核心的全栈技术成果与落地成果 [2] - 公司发布“夸娥万卡”高效训练智算集群,展示了其支撑万亿参数模型训练的工程化能力与可靠性,在多项关键精度指标上达到国际主流水平 [2] - 公司联合硅基流动,在DeepSeek R1 671B全量模型上实现推理性能突破,其MTT S5000单卡Prefill吞吐突破4000 tokens/s、Decode吞吐突破1000 tokens/s,树立国产推理性能标杆 [2] - 公司正式发布全新个人智算平台,包括搭载智能SoC芯片“长江”的AI算力本MTT AIBOOK,以及迷你型计算设备MTT AICube [2]
摩尔线程 突发大消息!
中国基金报· 2025-12-20 21:32
公司技术发布 - 摩尔线程召开首届MUSA开发者大会,展示了以自主MUSA统一架构为核心的全栈技术成果 [2] - 公司揭晓新一代全功能GPU架构“花港”,在计算密度、能效、精度支持、互联能力及图形技术等方面实现全面突破 [3] - 基于“花港”架构,公司公布了两款未来芯片的技术路线:“华山”专注AI训推一体与超大规模智能计算,“庐山”专攻高性能图形渲染 [4] - 公司正式发布夸娥万卡智算集群,具备全精度、全功能通用计算能力,在万卡规模下能实现高效稳定的AI训练与推理 [5] 产品性能与特性 - “花港”GPU架构基于新一代指令集,算力密度提升50%,支持从FP4到FP64的全精度端到端计算,新增MTFP6/MTFP4及混合低精度支持 [3] - “花港”架构集成新一代异步编程模型,并通过自研MTLink高速互联技术,支持十万卡以上规模智算集群扩展 [3] - “花港”架构内置AI生成式渲染架构,增强硬件光线追踪加速引擎,完整支持DirectX 12 Ultimate [3] - 未来芯片“庐山”的AI计算性能提升64倍,几何处理性能提升16倍,光线追踪性能提升50倍,并显著增强纹理填充、原子访存能力及显存容量 [4] - 夸娥万卡智算集群浮点运算能力达到10Exa-Flops,训练算力利用率在Dense大模型上达60%,在MOE大模型上达40%,有效训练时间占比超过90%,训练线性扩展效率达95% [5] 行业动态与竞争 - 在摩尔线程开发者大会前,中科曙光在光合组织2025人工智能创新技术大会上发布了曙光scaleX万卡超集群系统,这是国产万卡级算力集群首次以真机形式公开亮相 [6] - 中科曙光的scaleX万卡超集群在超节点架构、高速互连网络等方面实现了多项创新突破,部分技术与能力据称已超越英伟达研发路线图的2027年NVL576里程节点 [6] 公司前瞻性布局 - 摩尔线程已发布MT Lambda具身智能仿真训练平台,深度融合物理、渲染与AI三大引擎,构建了开发、仿真、训练的高效统一环境 [6] - 公司推出基于智能SoC芯片“长江”、AI模组MTT E300和夸娥智算集群“端云结合”的MT Robot具身智能解决方案 [6]
摩尔线程,发布新一代GPU架构
21世纪经济报道· 2025-12-20 21:32
核心观点 - 摩尔线程在登陆科创板后举办首届开发者大会,展示了其基于自研MUSA统一架构的全栈技术成果,并发布了下一代GPU架构“花港”及多款芯片产品,旨在通过架构创新弥补工艺限制,提升国产GPU在AI和高性能图形计算领域的竞争力 [1][2] 技术架构与芯片发布 - 发布新一代全功能GPU架构“花港”,通过全新指令集和异步编程模型实现“工艺不够,架构来补”,在相同工艺下算力密度提升50%,效能提升10倍,支持从FP4到FP64的全精度计算 [1][2] - 基于“花港”架构推出“华山”芯片,面向AI训推一体与超大规模智能计算,其浮点算力、访存带宽、高速互联带宽介于英伟达Blackwell和Hopper架构之间,访存容量优于两者 [4][5] - 同步发布“庐山”芯片,侧重高性能图形渲染,其AI计算性能提升64倍,几何处理性能提升16倍,光线追踪性能提升50倍,并增强了纹理填充和显存容量 [5] - 发布面向端侧的“长江”SoC芯片,集成于MTT AIBOOK笔记本电脑,端侧AI算力为50 TOPS,并预告了迷你计算设备MTT AICube [9] 智算集群与工程化能力 - 发布“夸娥”万卡智算集群,浮点运算能力达到10 Exa-Flops [5] - 该集群在万卡规模下,对Dense大模型的训练算力利用率(MFU)为60%,对MoE大模型的算力利用率为40%,有效训练时间占比超过90%,训练线性扩展效率为95% [5] - 在推理性能实测中,与硅基流动合作优化DeepSeek R1 671B全量模型,MTT S5000单卡的Prefill吞吐超过4000 tokens/s,Decode吞吐超过1000 tokens/s [5] 软件生态与开发者支持 - 升级MUSA统一计算架构至5.0版本,其核心计算库muDNN的GEMM和FlashAttention效率超过98%,通信效率达到97%,编译器性能提升3倍 [8] - 计划逐步开源计算加速库、通信库及系统管理框架等核心组件,并披露了兼容跨代GPU的中间语言MTX、量子计算融合框架MUSA-Q及计算光刻库muLitho等前瞻技术 [8] - 宣布建设MUSA生态中心并启动开发者计划,为科研与创新提供算力支持 [10] 图形技术与前沿领域布局 - 图形技术已支持DirectX 12、OpenGL 4.6、Vulkan 1.3等主流API,并与国产CPU及操作系统完成适配,即将完整支持DirectX 12 Ultimate [10] - 推出AI生成式渲染技术MTAGR 1.0,尝试将渲染范式从计算转向生成 [10] - 在具身智能领域发布MT Lambda仿真训练平台,并计划在2026年第一季度开源关键仿真加速组件Mujoco-warp-MUSA [10] - 提及在科学智能(AI4S)、量子科技、AI for 6G等前沿交叉领域的布局 [10] 公司发展历程与市场表现 - 公司成立于2020年10月,核心团队包括原英伟达中国区总经理张建中及CTO张钰勃,技术路线对标英伟达的通用GPU路径 [11] - 过去四年保持每年迭代一个芯片架构的节奏:2022年“苏堤”架构解决信创PC GPU国产化;2023年“春晓”架构带来量产游戏显卡和云端渲染芯片;2024年“曲院”架构开启AI训推一体并实现千卡集群;今年基于“平湖”架构的S5000已建成万卡智算集群 [8] - 公司于12月5日以114.28元/股登陆科创板,截至12月19日收盘,股价累计涨幅达481%,报664.10元/股,市值约为3121.46亿元 [11] 行业背景 - 受国际环境对高端芯片进口限制的影响,国产AI芯片行业受到资本市场大力追捧,市场空间有所增长 [11]
AI进化速递 | 摩尔线程新GPU架构可支持十万卡规模集群
第一财经· 2025-12-20 21:31
人工智能政策与产业发展 - 浙江省加快推动人工智能创新发展高地建设 全面实施"人工智能+"行动 [1] - 我国首套全国产化VTS系统落地大连 为船舶配备"AI护航员" [1] 人工智能硬件与基础设施 - 摩尔线程发布新GPU架构 可支持十万卡规模集群 [1] 人工智能模型与应用 - 苹果公司正在开发名为DarkDiff的AI模型 旨在提升暗光环境下的拍摄画质 [1][3] - 微软为其Copilot新增语音实时编辑功能 [1][3]
周末重磅!摩尔线程 首次公开
上海证券报· 2025-12-20 21:24
核心观点 - 摩尔线程在首届MUSA开发者大会上,首次公开了其全功能GPU技术路线图,并发布了包括新一代GPU架构“花港”、夸娥万卡智算集群、AI算力本等一系列技术与产品进展,标志着公司已构建起贯穿“芯-边-端-云”的完整自主技术栈,并致力于加速构建国产计算产业生态 [2][3][11] 新一代GPU架构与芯片路线图 - 公司宣布其自主研发的元计算统一架构MUSA升级至5.0版本,在全栈统一性、效能与生态开放性上取得关键突破 [3] - 基于MUSA发布了新一代GPU架构“花港”,基于新一代指令集,支持FP4到FP64的全精度计算,算力密度提升50%,能效提升10倍,可支持十万卡以上规模智算集群 [3] - 基于“花港”架构,公布了未来两款芯片技术路线:“华山”专注AI训推一体与超大规模智能计算,支持从FP4至FP64的全精度计算,为万卡级智算集群提供算力支撑 [3] - “庐山”专攻高性能图形渲染,其AI计算性能提升64倍,几何处理性能提升16倍,光线追踪性能提升50倍,并显著增强纹理填充、原子访存能力及显存容量,集成AI生成式渲染等新技术 [5] 夸娥万卡智算集群与算力突破 - 发布了夸娥万卡智算集群,具备全精度、全功能通用计算能力,在万卡规模下实现高效稳定的AI训练与推理 [7] - 该集群浮点运算能力达到10Exa-Flops,训练算力利用率在Dense大模型上达60%,在MOE大模型上达40%,有效训练时间占比超过90%,训练线性扩展效率达95% [7] - 推理侧,联合硅基流动在DeepSeek-R1 671B全量模型上实现单卡推理性能突破,MTT S5000单卡Prefill吞吐突破4000tokens/s、Decode吞吐突破1000tokens/s [7] - 训练侧,基于原生FP8能力完整复现顶尖大模型训练流程,Flash Attention算力利用率超95%,并突破FP8累加精度等关键技术瓶颈 [7] - 发布了MTT C256超节点的架构规划,采用计算与交换一体化的高密设计,旨在系统性提升万卡集群的训练效能与推理能力 [7] 图形计算与具身智能布局 - 图形产品已全面支持DirectX 12、OpenGL 4.6、Vulkan 1.3等主流API,并将完整支持DirectX 12 Ultimate,与国产主流CPU及操作系统完成了全栈适配 [8] - 在核心渲染技术上取得两项关键突破:基于“花港”架构的硬件光线追踪加速引擎,可支持DirectX Raytracing;推出全自研的AI生成式渲染技术MTAGR 1.0 [8] - 发布了MT Lambda具身智能仿真训练平台,深度融合物理、渲染与AI三大引擎,构建开发、仿真、训练的统一环境 [8] - 推出基于智能SoC芯片“长江”、AI模组MTT E300和夸娥智算集群的MT Robot具身智能解决方案 [8] - 公司计划于2026年第一季度开源关键仿真加速组件Mujoco-warp-MUSA [9] - MUSA生态还与合作伙伴在科学智能、量子科技、AI for 6G等前沿交叉领域展开探索 [10] 生态建设与开发者体系 - 公司认为生态体系是GPU行业的核心护城河与价值所在,致力于以开放创新深化与生态伙伴的协同,共同构建国产计算产业生态 [11] - 以摩尔学院为平台,已构建产教融合的开发者成长体系,目前汇聚近20万名开发者与学习者 [11] - 通过“国产计算生态与AI教育共建行动”将前沿技术与产业实践带入全国200多所高校,吸引超10万名学子参与 [11] 端侧计算产品 - 发布了搭载智能SoC芯片“长江”的AI算力本MTT AIBOOK,提供50TOPS的端侧AI算力,实现了专业AI开发的“开箱即用”,并打破了Linux开发、Windows办公与Android应用之间的场景壁垒 [12] - 预告了基于“长江”SoC打造的迷你型计算设备MTT AICube,进一步丰富端侧计算产品形态 [12]
基于摩尔线程KUAE 智算集群,51视界构建下一代物理仿真体系
犀牛财经· 2025-12-20 21:18
公司与行业合作 - 摩尔线程与五一视界旗下仿真平台51Sim宣布深度合作,共同构建下一代物理AI仿真体系 [1] - 合作以国产GPU大规模算力为基础,以新一代仿真与世界模型技术为核心 [1] - 双方共同探索面向端到端智能驾驶、具身智能的物理AI基础设施建设路径 [1] 技术革新与行业痛点 - 传统仿真依赖人工建模和规则驱动,存在构建周期长、成本高、泛化能力有限的问题,与真实世界存在“置信度鸿沟” [3] - 51Sim以“4DGS重建 + 生成式世界模型”为基础,构建“重建 + 生成”的下一代仿真技术底座,推动仿真从“手工搭建”走向“AI自动生成” [3] - “重建 + 生成”的物理AI仿真体系对算力提出前所未有的要求,需要高并发、长时间、稳定的GPU计算资源 [3] 合作成果与落地应用 - 51Sim携手摩尔线程,基于海量、统一、可规模化的算力底座,构建了覆盖训练与推理的完整物理AI仿真体系 [3] - 该合作推动“重建 + 生成”能力进入工程化阶段,让物理AI的训练与推理场景从实验室走向真实业务的规模化落地 [3] - 共建的物理AI仿真体系已率先在智能驾驶领域实现规模化落地应用,支撑端到端智驾算法的闭环验证 [3] - 未来计划将智能驾驶领域的落地经验拓展到具身智能等更广泛的物理AI应用场景 [3] 资本协同与战略发展 - 摩尔线程是五一视界的战略股东,在资本层面为其坚定护航 [4] - 五一视界正以18C章程冲刺“Physical AI第一股”,计划于2025年12月30日在港交所正式挂牌 [4] - 两家公司先后踏上资本化道路,有望获得充足资金以加速技术研发与市场拓展,形成更强协同效应 [4] - 此举有望带动国产GPU和Physical AI产业链发展 [4]
摩尔线程与图灵量子达成合作 推动量子经典混合技术应用
中国证券报· 2025-12-20 20:04
文章核心观点 - 图灵量子与摩尔线程签署战略合作协议,聚焦量子-经典混合计算领域,旨在加速核心技术自主化与产业应用本土化,构建开放协同、自主可控的计算新生态 [1] 合作双方背景与能力 - 图灵量子构建了完全自主可控的光子芯片和量子算法双底层核心技术驱动能力,牵头建设国内首条光子芯片中试线,具备从芯片设计、制备、封装到算法与系统集成的全栈能力 [1] - 摩尔线程是国内第一家挂牌上市的GPU企业,具备全功能GPU芯片的设计与研发能力,产品矩阵覆盖人工智能、科学计算与图形渲染 [1] 合作具体方向与内容 - 在量子算法侧,合作将探索基于GPU的量子计算模拟加速路径,通过GPU加速量子机器学习算法的训练与推理,优化模型性能与计算效率,并以量子算法及云端服务形式为科学计算、生物医药、金融科技、航空航天、材料化学、密码分析、通信网络等领域提供计算支持 [2] - 在架构侧,双方将联合研发GPU与量子处理器协同的混合计算架构,构建跨区域、跨领域的“量子+经典”异构云算力协作平台 [2] - 在系统侧,双方将攻坚核心技术,助力构建大规模容错光量子计算机,并结合CPO光电共封等前沿技术,构建软硬一体、自主可控的新一代高性能计算底座 [2] 行业趋势与共识 - 量子-经典混合计算已成为全球芯片厂商的核心发展共识与布局重点 [1]
预售价9999元 摩尔线程发布AI算力笔记本
21世纪经济报道· 2025-12-20 19:58
公司产品发布 - 摩尔线程于12月20日发布AI算力本MTT AIBOOK笔记本 [2] - 该笔记本已在京东开放预售,32GB、1TB版本预售价为9999元 [2] - 笔记本搭载公司自主研发的智能SoC芯片“长江”,集成高性能全大核CPU与全功能GPU [2] 产品技术规格与性能 - 产品支持MUSA统一架构,异构AI算力达到50TOPS [2] - 芯片集成CPU与GPU,支持Windows虚拟机、Linux、安卓容器及所有国产操作系统 [2] 产品定位与功能 - 该笔记本集开发、办公、娱乐等功能于一体 [2]
摩尔线程发布AI算力本MTTAIBOOK,预售价9999元
36氪· 2025-12-20 19:26
公司产品发布 - 摩尔线程于12月20日在其首届MUSA开发者大会上发布了AI算力笔记本电脑MTTAIBOOK [1] - 该产品已在京东开放预售,32GB内存、1TB存储版本的预售价为9999元人民币 [1] - 笔记本搭载公司自主研发的智能SoC芯片“长江”,集成高性能全大核CPU和全功能GPU,支持MUSA统一架构 [1] - 产品异构AI算力达到50TOPS,集开发、办公、娱乐于一体,支持Windows虚拟机、Linux、安卓容器及所有国产操作系统 [1] 公司业务与市场表现 - 摩尔线程成立于2020年,主营业务是全功能GPU的设计与研发 [1] - 公司在五年时间内构建了从芯片、板卡到大规模集群及软件方案的全栈业务布局 [1] - 公司业务场景全面覆盖“云边端”(云端、边缘计算和终端) [1] - 公司于12月5日以114.28元的价格发行上市,上市首日股价大幅上涨425% [1]
摩尔线程,展现最新成果
财联社· 2025-12-20 19:18
核心观点 - 公司举办首届开发者大会,发布历时五年研发的新一代全功能GPU架构“花港”,并基于此公布了两款核心芯片、万卡智算集群及个人AI终端产品,展示了从芯片到软件再到系统与终端的全栈技术布局,战略意图从单一硬件供应商转向平台级算力基础设施商 [1][17] 技术架构与芯片发布 - 发布新一代全功能GPU架构“花港”,采用新一代指令集,算力密度较上一代提升50%,能效提升10倍,支持从FP4到FP64全精度,集成第一代AI生成式渲染架构和第二代光线追踪硬件加速引擎,计划明年量产 [2] - 基于“花港”架构公布两款核心芯片规划:“华山”芯片主打AI训推一体与超智融合,内置新一代异步编程模型,拥有全精度MMA及MTFP8/6/4混合低精度计算技术 [3][4] - “庐山”芯片专攻高性能图形渲染,优化任务分配与平衡,其AI计算性能较前代提升64倍,几何处理性能提升16倍,完整支持DirectX 12 Ultimate [4] 智算系统与性能展示 - 发布“夸娥”万卡智算集群,浮点运算能力达10Exa-Flops,在Dense大模型上的训练算力利用率达60%,在MOE大模型上为40%,有效训练时间占比超过90% [6] - 展示与硅基流动合作的推理性能成果:在DeepSeek R1 671B全量模型上,MTT S5000单卡的Prefill吞吐量突破4000 tokens/s,Decode吞吐量突破1000 tokens/s [7] - 分享面向下一代智算中心的MTT C256超节点架构规划,旨在通过高密硬件设计提升集群能效 [8] 软件生态与开发者工具 - 自研MUSA架构迎来全栈软件升级至5.0版本,核心计算库muDNN的GEMM/FlashAttention效率超过98%,通信效率达97% [9] - 明确开源计划,将逐步向开发者社区开放计算加速库、通信库及系统管理框架的核心组件 [10] - 计划推出兼容跨代GPU指令架构的中间语言MTX,以及面向渲染与AI融合计算的编程语言muLang,以降低开发者适配门槛 [11] 终端产品与市场拓展 - 正式进军个人智算终端硬件领域,发布首款AI算力本MTT AIBOOK,售价9999元(32GB+1TB版本),预计2026年1月10日开售 [12][13] - MTT AIBOOK搭载自研智能SoC芯片“长江”,集成高性能全大核CPU及全功能GPU,异构AI算力达50TOPS,内置AI智能体和2D数字人“小麦”,支持0.5秒生成数字人形象,预装Qwen3-8B大模型,支持多操作系统,意图将MUSA生态从云端下沉至开发者桌面端 [14] 行业背景与战略定位 - 行业正处于从追求参数规模向追求推理效能和生态落地的转型期 [17] - 发展“主权AI”的核心在于算力自主、算法自强与生态自立,构建国产十万卡级别智算系统是必须完成的产业基础设施任务,且需构建易用的开发环境以留住开发者社群 [15] - 公司通过展示的全栈体系,反映出其试图摆脱单一硬件供应商身份,转向平台级算力基础设施商的战略意图 [17] 资本市场表现 - 公司股价近期波动明显,12月19日收报664.10元/股,跌幅5.9%,相较于12月11日高点累计跌幅达29.4%,但相较于发行价涨幅仍超过481%,总市值维持在3121.46亿元 [16]