Workflow
MTT AIBOOK
icon
搜索文档
周末重磅!摩尔线程 首次公开
上海证券报· 2025-12-20 21:24
核心观点 - 摩尔线程在首届MUSA开发者大会上,首次公开了其全功能GPU技术路线图,并发布了包括新一代GPU架构“花港”、夸娥万卡智算集群、AI算力本等一系列技术与产品进展,标志着公司已构建起贯穿“芯-边-端-云”的完整自主技术栈,并致力于加速构建国产计算产业生态 [2][3][11] 新一代GPU架构与芯片路线图 - 公司宣布其自主研发的元计算统一架构MUSA升级至5.0版本,在全栈统一性、效能与生态开放性上取得关键突破 [3] - 基于MUSA发布了新一代GPU架构“花港”,基于新一代指令集,支持FP4到FP64的全精度计算,算力密度提升50%,能效提升10倍,可支持十万卡以上规模智算集群 [3] - 基于“花港”架构,公布了未来两款芯片技术路线:“华山”专注AI训推一体与超大规模智能计算,支持从FP4至FP64的全精度计算,为万卡级智算集群提供算力支撑 [3] - “庐山”专攻高性能图形渲染,其AI计算性能提升64倍,几何处理性能提升16倍,光线追踪性能提升50倍,并显著增强纹理填充、原子访存能力及显存容量,集成AI生成式渲染等新技术 [5] 夸娥万卡智算集群与算力突破 - 发布了夸娥万卡智算集群,具备全精度、全功能通用计算能力,在万卡规模下实现高效稳定的AI训练与推理 [7] - 该集群浮点运算能力达到10Exa-Flops,训练算力利用率在Dense大模型上达60%,在MOE大模型上达40%,有效训练时间占比超过90%,训练线性扩展效率达95% [7] - 推理侧,联合硅基流动在DeepSeek-R1 671B全量模型上实现单卡推理性能突破,MTT S5000单卡Prefill吞吐突破4000tokens/s、Decode吞吐突破1000tokens/s [7] - 训练侧,基于原生FP8能力完整复现顶尖大模型训练流程,Flash Attention算力利用率超95%,并突破FP8累加精度等关键技术瓶颈 [7] - 发布了MTT C256超节点的架构规划,采用计算与交换一体化的高密设计,旨在系统性提升万卡集群的训练效能与推理能力 [7] 图形计算与具身智能布局 - 图形产品已全面支持DirectX 12、OpenGL 4.6、Vulkan 1.3等主流API,并将完整支持DirectX 12 Ultimate,与国产主流CPU及操作系统完成了全栈适配 [8] - 在核心渲染技术上取得两项关键突破:基于“花港”架构的硬件光线追踪加速引擎,可支持DirectX Raytracing;推出全自研的AI生成式渲染技术MTAGR 1.0 [8] - 发布了MT Lambda具身智能仿真训练平台,深度融合物理、渲染与AI三大引擎,构建开发、仿真、训练的统一环境 [8] - 推出基于智能SoC芯片“长江”、AI模组MTT E300和夸娥智算集群的MT Robot具身智能解决方案 [8] - 公司计划于2026年第一季度开源关键仿真加速组件Mujoco-warp-MUSA [9] - MUSA生态还与合作伙伴在科学智能、量子科技、AI for 6G等前沿交叉领域展开探索 [10] 生态建设与开发者体系 - 公司认为生态体系是GPU行业的核心护城河与价值所在,致力于以开放创新深化与生态伙伴的协同,共同构建国产计算产业生态 [11] - 以摩尔学院为平台,已构建产教融合的开发者成长体系,目前汇聚近20万名开发者与学习者 [11] - 通过“国产计算生态与AI教育共建行动”将前沿技术与产业实践带入全国200多所高校,吸引超10万名学子参与 [11] 端侧计算产品 - 发布了搭载智能SoC芯片“长江”的AI算力本MTT AIBOOK,提供50TOPS的端侧AI算力,实现了专业AI开发的“开箱即用”,并打破了Linux开发、Windows办公与Android应用之间的场景壁垒 [12] - 预告了基于“长江”SoC打造的迷你型计算设备MTT AICube,进一步丰富端侧计算产品形态 [12]
摩尔线程,展现最新成果
财联社· 2025-12-20 19:18
核心观点 - 公司举办首届开发者大会,发布历时五年研发的新一代全功能GPU架构“花港”,并基于此公布了两款核心芯片、万卡智算集群及个人AI终端产品,展示了从芯片到软件再到系统与终端的全栈技术布局,战略意图从单一硬件供应商转向平台级算力基础设施商 [1][17] 技术架构与芯片发布 - 发布新一代全功能GPU架构“花港”,采用新一代指令集,算力密度较上一代提升50%,能效提升10倍,支持从FP4到FP64全精度,集成第一代AI生成式渲染架构和第二代光线追踪硬件加速引擎,计划明年量产 [2] - 基于“花港”架构公布两款核心芯片规划:“华山”芯片主打AI训推一体与超智融合,内置新一代异步编程模型,拥有全精度MMA及MTFP8/6/4混合低精度计算技术 [3][4] - “庐山”芯片专攻高性能图形渲染,优化任务分配与平衡,其AI计算性能较前代提升64倍,几何处理性能提升16倍,完整支持DirectX 12 Ultimate [4] 智算系统与性能展示 - 发布“夸娥”万卡智算集群,浮点运算能力达10Exa-Flops,在Dense大模型上的训练算力利用率达60%,在MOE大模型上为40%,有效训练时间占比超过90% [6] - 展示与硅基流动合作的推理性能成果:在DeepSeek R1 671B全量模型上,MTT S5000单卡的Prefill吞吐量突破4000 tokens/s,Decode吞吐量突破1000 tokens/s [7] - 分享面向下一代智算中心的MTT C256超节点架构规划,旨在通过高密硬件设计提升集群能效 [8] 软件生态与开发者工具 - 自研MUSA架构迎来全栈软件升级至5.0版本,核心计算库muDNN的GEMM/FlashAttention效率超过98%,通信效率达97% [9] - 明确开源计划,将逐步向开发者社区开放计算加速库、通信库及系统管理框架的核心组件 [10] - 计划推出兼容跨代GPU指令架构的中间语言MTX,以及面向渲染与AI融合计算的编程语言muLang,以降低开发者适配门槛 [11] 终端产品与市场拓展 - 正式进军个人智算终端硬件领域,发布首款AI算力本MTT AIBOOK,售价9999元(32GB+1TB版本),预计2026年1月10日开售 [12][13] - MTT AIBOOK搭载自研智能SoC芯片“长江”,集成高性能全大核CPU及全功能GPU,异构AI算力达50TOPS,内置AI智能体和2D数字人“小麦”,支持0.5秒生成数字人形象,预装Qwen3-8B大模型,支持多操作系统,意图将MUSA生态从云端下沉至开发者桌面端 [14] 行业背景与战略定位 - 行业正处于从追求参数规模向追求推理效能和生态落地的转型期 [17] - 发展“主权AI”的核心在于算力自主、算法自强与生态自立,构建国产十万卡级别智算系统是必须完成的产业基础设施任务,且需构建易用的开发环境以留住开发者社群 [15] - 公司通过展示的全栈体系,反映出其试图摆脱单一硬件供应商身份,转向平台级算力基础设施商的战略意图 [17] 资本市场表现 - 公司股价近期波动明显,12月19日收报664.10元/股,跌幅5.9%,相较于12月11日高点累计跌幅达29.4%,但相较于发行价涨幅仍超过481%,总市值维持在3121.46亿元 [16]
摩尔线程亮出全栈技术底牌:“花港”新架构与万卡集群冲击高端GPU市场格局
环球网· 2025-12-20 15:00
【环球网科技报道 记者 李文瑶】12月20日,摩尔线程在首届MUSA开发者大会(MDC 2025)上,系统展示了其在全功能GPU领域从架构 创新、集群能力到生态建设的突破。 其中最引人关注的是新一代GPU架构"花港"的亮相,以及可支撑万亿参数模型训练的"夸娥"万卡智算集群的实际效率披露。 架构迭代:"花港"亮相,双芯片路线瞄准AI与图形 大会的核心发布之一是新一代全功能GPU架构"花港"。根据摩尔线程公布的信息,该架构在计算密度上提升50%,效能提升最高达10倍, 并完整支持从FP4到FP64的全精度计算。尤为关键的是,架构层面集成了自研的MTLink高速互联技术,为十万卡规模以上的集群扩展提供 了底层支持。 这一架构与产品路线的发布,标志着摩尔线程不再局限于单一场景的加速卡产品,而是向覆盖AI计算、图形渲染、科学计算等全场景 的"全功能GPU"平台迈进。在业内人士看来,这既是技术能力的体现,也是应对市场多元需求、构建更宽生态护城河的战略选择。 集群能力:万卡训练效率指标首度公开 如果说芯片架构是"点"的突破,那么集群能力则是"面"的验证。本次大会上,摩尔线程首次系统披露了其"夸娥"万卡智算集群的关键工程 效 ...
摩尔线程跨界PC?公司发布MTT AIBOOK 内置AI智能体
每日经济新闻· 2025-12-20 13:03
现场发布了MTT AIBOOK 图片来源:每经记者杨卉摄 (文章来源:每日经济新闻) 今日,被称为"国产GPU(图形处理器)第一股"的摩尔线程(SH688795)在北京举办了首届"MUSA开发者"大会,《每日经济新闻》记者现场参会。会上, 摩尔线程创始人、董事长兼首席执行官张建中发布了摩尔线程的首款个人手提电脑产品——MTT AIBOOK。据张建中介绍,这款PC(个人电脑)将于下月 起供货。据悉,MTT AIBOOK内置AI(人工智能)智能体和AI数字人,可切换Android、Windows、Linux三种系统。 ...