Workflow
全功能GPU
icon
搜索文档
预计增速超230%!摩尔线程2025年营收有望突破15亿元,国产全功能GPU迈入规模商用阶段
每日经济新闻· 2026-01-22 17:44
公司2025年业绩表现 - 2025年预计实现营业收入14.50亿元至15.20亿元,同比增长230.70%至246.67% [1] - 营收从2024年的4.38亿元跃升至2025年预计超14.5亿元,增长曲线陡峭 [2] - 在持续高研发投入背景下实现翻倍营收,标志着国产GPU正式迈入商业化落地阶段 [1] 核心产品与技术突破 - 基于第四代GPU架构打造的旗舰产品——训推一体全功能GPU智算卡MTT S5000在2025年实现规模量产,成为拉动收入增长的核心引擎 [1][2] - S5000万卡集群支持万亿参数模型训练,线性扩展效率可达95%,有效训练时间超90% [2] - S5000在Dense大模型上MFU达60%,在MOE大模型上MFU达40%,计算效率达到国际同代产品集群先进水平 [2] - S5000千卡集群支持具身大脑模型RoboBrain2.5全流程训练,验证了国产算力在具身智能领域的稳定高效与多模态适配能力 [3] - 在DeepSeek R1671B全量模型上,S5000单卡Prefill吞吐超4000 tokens/s,Decode吞吐超1000 tokens/s,树立国产推理性能新标杆 [3] - 公司已推出五代全功能GPU架构,最新架构为“花港” [5] 市场驱动因素与商业化进展 - 2025年被称为“AI大模型规模化落地元年”,各行各业对高性能算力需求井喷 [2] - 在国产替代政策推动下,党政、金融、能源、智能制造等领域对自主可控GPU的采购进入实质放量阶段 [2] - AIGC、数字孪生等新兴场景不断拓宽算力边界,为全功能GPU提供更广阔市场空间 [2] - 系列产品性能获得市场验证,直接推动了客户订单与集群部署的快速上量 [3] - 公司已从“技术研发”大步迈入“规模商用”阶段,产品在多个高复杂度场景中实现稳定运行 [3] 公司发展战略与生态建设 - 公司选择全功能GPU技术路线,需同步攻克AI计算、图形渲染、视频处理、科学计算等全栈能力 [4] - 发展轨迹与英伟达有相通之处,从GPU供应商演变为算力基础设施提供者,实现从单卡到大规模集群的拓展 [4] - 重点从孤立性能提升,转向系统级的可靠性、扩展效率与整体算力利用率等指标 [4] - 基于“GPU+CPU+NPU+VPU”的异构计算布局,将产品线延伸至AI PC、边缘智能模组及智能座舱芯片等新兴领域 [5] - 已构建自主研发的元计算统一计算架构MUSA,覆盖从芯片架构到软件运行库的全栈技术体系 [5] - MUSA支持国际通用CPU系统及国产CPU操作系统和国内开发环境,旨在争夺下一代计算平台的生态话语权 [5][7] 研发投入与资金保障 - 2022年至2025年上半年,公司累计研发投入金额超43亿元 [6] - 上市所募资金将主要投向三大核心研发项目:新一代自主可控AI训推一体芯片、新一代自主可控图形芯片、新一代自主可控AI SoC芯片 [6] - 公司将使用自有资金补足募投项目的资金需求,保障GPU研发项目顺利推进 [6] 行业前景与公司定位 - 国内AI算力需求年均增速超过50%,供给端依赖进口的格局亟待改变 [7] - 在“数字中国”“东数西算”等国家战略牵引下,自主GPU替代空间打开一个巨大的增量市场 [7] - 仅以信创与行业智算中心建设估算,国产GPU的潜在市场规模已达千亿级别 [7] - 在国内芯片企业中,能坚持全功能GPU技术路线并实现大规模产品落地的玩家凤毛麟角,技术壁垒更高 [7] - 公司核心团队多来自国际GPU巨头,拥有深厚研发与产品化经验,正带领公司从“可用”走向“好用” [7] - 公司全功能GPU的定位与持续迭代能力,使其成为国产算力底座中不可或缺的核心拼图 [8]
摩尔线程:五年“长考”,筑起全功能算力的硬核长城
半导体行业观察· 2025-12-26 09:57
文章核心观点 - 国产GPU厂商摩尔线程正通过构建软硬深度融合的统一架构MUSA和繁荣的开发者生态,以突破长期由英伟达CUDA主导的行业壁垒,其战略核心是打造“全功能GPU”作为通用算力底座,并已取得显著的技术与生态进展 [1][3][12] MUSA统一系统架构 - MUSA是摩尔线程自主研发的元计算统一系统架构,覆盖从芯片架构、指令集、编程模型到软件运行库及驱动程序框架的全栈技术体系,而不仅仅是一个软件包 [4][5][6] - MUSA定义了从芯片设计到软件生态的统一技术标准,是类似于Android或Windows的平台,所有公司软硬件产品均基于此架构 [8] - MUSA 5.0软件栈全面升级,实现了对全功能GPU四大引擎的深度适配,为AI训练、3D图形渲染到科学计算等全场景应用提供统一技术底座 [35][36][37] - MUSA 5.0的核心竞争力在于“无边界”适配能力,完美兼容国际主流与国产CPU操作系统及开发环境,计划于明年上半年规模化落地 [37] 全功能GPU战略 - 公司坚持“全功能GPU”路线,旨在打造一个能同时实现图形图像处理、AI张量计算、物理仿真和超高清视频编解码等多种任务协同处理的“万能算力底座” [9][12] - 全功能GPU的优势在于“图算结合”,能够跨域支持多模态未来对AI计算、图形渲染和视频传输的多样化需求,无论计算范式如何变迁都能保持灵活性 [14][15] - 全功能GPU不仅面向AI模型训练和智算中心,也能支撑游戏图形、视频渲染等大众级应用场景,具备高度通用性与生态承载力 [12] 芯片架构与产品进展 - 公司自2022年起保持每年发布一代新架构的节奏,五年推出五代架构,最新一代为“花港”架构 [16][17] - “花港”架构基于新一代指令集,算力密度提升50%,计算能效实现10倍提升,新增MTFP6/MTFP4及混合低精度端到端加速技术 [19] - “花港”架构提供新一代异步编程模型加速技术,并集成自研高速互联MTLink技术,可支持十万卡以上规模智算集群 [19] - 基于“花港”架构,公司正在研发两款GPU芯片:“华山”和“庐山” [23] - “华山”是AI训推一体芯片,对标国外顶尖产品,集成新一代Tensor Core、专为LLM定制的加速引擎及ACE2.0异步通信引擎,支持超十万卡级别的“AI工厂”技术 [24][25][27] - “庐山”是高性能图形渲染芯片,与S80相比,3A游戏性能提升15倍,AI计算性能提升64倍,几何处理性能提升16倍,并内置AI生成式渲染功能 [28][30] 大规模集群与AI工厂 - 公司推出超十万卡级AI工厂技术,突破了传统GPU集群瓶颈,支持Scale-up系统可扩展至1024个GPU [32][34] - 新一代MTLink 4.0技术支持多种协议兼容,具备1314 GB/s的片间互联带宽 [34] - 通过ACE 2.0异步通信引擎、RAS 2.0容错能力及MTT C256超节点解决方案,确保超大规模集群的高效、稳定与高可用性 [34] 开发者生态建设 - 公司认识到开发者生态是决定芯片厂商生死存亡的关键,正致力于解决迁移成本高、工具链不成熟等痛点,目标是让国产GPU从“能用”到“好用”再到“愿意用” [45][46] - MUSA软件栈的策略是先对齐主流生态的使用习惯,降低开发者学习与迁移成本,同时通过AIBOOK等工具降低生态参与门槛 [47] - 为发挥底层架构创新,公司提出两条路径:一是通过高层抽象的DSL/编译技术将硬件优势显性化;二是与开发者及平台伙伴深度协作进行生态共建 [49][51] - 生态共建已见成效,例如与硅基流动对MTT S5000深度优化后,在DeepSeek 671B全量模型推理中,单卡Prefill吞吐突破4000 tokens/s,Decode吞吐突破1000 tokens/s [51] 具身智能新赛道 - 公司入局具身智能领域,发布仿真训练平台MT Lambda,整合物理、渲染与AI三大核心引擎,提供从场景构建到仿真训练的高效工作流 [38][39] - 公司首颗AI SoC芯片“长江”正式亮相,集成了CPU、GPU、NPU、VPU、DPU、DSP和ISP等多维算力核心,为边缘侧提供强悍计算内核 [39] - 公司推出完整解决方案MT Robot,通过KUAE智算集群作为“云端大脑”和内置“长江”芯片的MTT E300模组作为“端侧小脑”,实现从虚拟训练到物理落地的全栈路径 [42][43] 公司技术积累与投入 - 过去五年,公司已推出5颗芯片,研发投入超43亿元,研发人员占比高达77%,活跃开发者生态超20万 [3] - 截至今年6月30日,公司已申请专利1000余件,其中授权专利500余件,发明专利468件,专利数量在国内GPU企业中领先 [21] - “花港”架构集成了自研的4层安全架构(安全域、信任域、保护域和功能域),为芯片提供安全守护 [21]
摩尔线程张建中和他的伙伴们
YOUNG财经 漾财经· 2025-12-23 19:19
公司上市与市场表现 - 摩尔线程于12月5日在上海证券交易所科创板上市,从受理到上市仅用时5个月,上市速度极快 [4] - 上市首日收盘涨幅达425.46%,总市值达到2822.52亿元 [4] - 公司被市场视为“国内GPU第一股”,目标是成为英伟达的平替 [4] 创始人张建中 - 张建中是公司创办人、董事长及实际控制人,直接持股11.06%,并通过一致行动协议及员工持股平台合计控制公司36.36%的股份 [6] - 根据彭博亿万富翁指数,其持有的股份价值超过43亿美元(约304亿元人民币) [6] - 张建中曾担任英伟达全球副总裁兼大中华区总经理,在任期间将英伟达在中国独立GPU市场份额从不足50%提升至近80% [7][9] - 其职业生涯始于惠普与戴尔,具备“技术+市场”双轮驱动能力,于2006年加入英伟达 [8][9] - 2019年美国对华芯片断供事件启发其创业,认为中国必须有自己的全功能GPU [10] - 在2023年10月遭遇美国禁令,台积电被禁止为其代工时,积极应对,砍掉非核心游戏显卡业务,将资源倾斜至图形渲染和AI算力,并在国内寻找代工厂 [11] 公司业务与财务表现 - 公司定位为全功能GPU芯片研发及AI计算解决方案提供商 [4] - 2022-2024年间,公司收入年复合增长率达208.44% [4] - 2025年上半年营收达7.02亿元,超越过去三年总和,其中AI智算业务收入占比94.73%,毛利率提升至69.14% [11] - 2025年上半年,前两大客户(客户R和公司B)贡献收入分别为3.97亿元和2.17亿元,合计占总营收的80%,其购买的产品均为“AI智算集群设备” [12] - 公司持续高研发投入,2024年研发费用率高达310%,同年营收4.38亿元,同比增长约253% [20] - 截至2025年6月底,公司在洽谈订单合计超过20亿元,覆盖AI智算、专业图形加速等多个领域,预计最早于2027年实现合并报表盈利 [20] 技术产品与研发 - “全功能GPU”指能同时支持图形渲染、科学计算(含AI计算)及多媒体编解码三大核心功能的GPU芯片 [17] - 公司已成功量产5颗GPU芯片,迭代四代GPU架构和智能SoC产品,产品覆盖芯片、游戏卡、计算卡、智算集群 [19] - 2021年至2024年,公司保持每年发布一款新GPU架构的节奏 [19] - 为应对美国禁止使用英伟达开发工具,公司推出了自研的MUSA架构,以兼容主流平台并实现CUDA项目快速迁移 [11] - 截至2025年6月,公司已获得授权专利514项,位居国内GPU企业前列 [18] 创始团队与核心人员 - 创始团队多人来自英伟达、AMD等公司,被红杉盛赞为“全球顶尖GPU团队” [7] - 2022-2024年,公司向724名员工支付股份激励费用达7.68亿元,人均超百万元,覆盖64%的员工 [13] - 联合创始人、董事兼副总经理张钰勃财富资产达17亿美元(约120亿元人民币) [13] - 联合创始人、董事周苑与副总经理王东的财富值均达到14亿美元(约100亿元人民币) [13] - 核心技术人员共四位,包括张钰勃、杨上山、王华和马凤翔 [16] - 多位高管及核心成员拥有英伟达、华为、地平线等公司的工作经历 [14][15][16] 行业背景与竞争格局 - 人工智能与大模型引爆算力革命,为芯片生意带来极大盈利空间 [4] - GPU因其在“并行计算”方面的优势,成为驱动AI和科学革命的算力引擎,是AI时代最重要的计算芯片之一 [17] - 中信证券研报预测,中国GPU市场规模在2025年预计突破1200亿元 [18] - 公司主要市场竞争者包括英伟达、AMD、海光信息、寒武纪、沐曦股份、壁仞科技、天数智芯、燧原科技、昆仑芯等 [19] - 胡润2025全球独角兽榜显示,摩尔线程以310亿元的估值排名第212位 [4][18]
MDC2025:全功能GPU路线清晰,MUSA生态进入规模化验证阶段
海通国际· 2025-12-23 13:14
报告行业投资评级 * 报告未明确给出对摩尔线程或相关行业的投资评级 [1][8] 报告核心观点 * 报告认为,摩尔线程在首届MUSA开发者大会上展示了其全功能GPU技术路线图的清晰度与MUSA生态系统的规模化验证进展,公司在坚持全功能GPU路线、构建统一软件生态和拓展前沿应用方面展现出长期潜力,但同时也面临更高的研发与工程复杂度 [1][2][10] 根据相关目录分别进行总结 软件生态 (MUSA 5.0) * MUSA 5.0已形成从指令集、编程模型、编译器到通信库的全栈体系,工程化表现接近国际主流水平 [2][10] * 开发体验:原生支持MUSA C,同时兼容TileLang、Triton,降低了CUDA的迁移门槛 [2][14] * 性能指标:muDNN中GEMM/FlashAttention效率超过98%,通信效率约97%,编译器性能提升约3倍 [2][14] * 生态策略:明确了逐步开源计算库、通信库、系统管理框架等核心组件的路线图 [2][14] * 前沿扩展:布局了MTX中间语言、muLang、MUSA-Q、muLitho等,覆盖渲染、量子计算与计算光刻领域 [2][14] 硬件架构与产品路线 (花港架构) * 新一代全功能GPU架构“花港”在算力密度、能效、精度覆盖与互联能力上全面升级,支持FP4至FP64全精度计算,并引入混合低精度(MTFP6/MTFP4) [2][10] * 花港架构强调异步编程模型与超大规模互联(MTLink),为万卡乃至十万卡集群提供扩展基础 [2][10] * 公司基于花港架构给出了清晰的产品分化路径:“华山”面向AI训推一体与超大规模智算,定位下一代AI工厂底座;“庐山”专注高性能图形渲染,在几何、AI、光追等指标上实现数量级提升,全面对标3A游戏与专业图形创作需求 [4][14] 系统级工程能力 (夸娥集群) * “夸娥”万卡智算集群是对外展示工程能力的重要里程碑,在Dense模型与MoE模型上分别实现约60%与约40%的MFU(模型浮点利用率),线性扩展效率约95%,有效训练时间占比超过90% [3][11] * 训练侧完整复现了FP8训练流程;推理侧与硅基流动合作,在DeepSeek R1 671B模型上实现单卡Prefill(预填充)大于4000 tokens/s、Decode(解码)大于1000 tokens/s的吞吐量 [3][11] * 公司公布了MTT C256超节点的前瞻规划,强调计算与交换一体化的高密架构,为下一代超大规模智算中心做准备 [3][11] 前沿应用布局 (具身智能) * 公司发布MT Lambda具身智能仿真训练平台,以MUSA统一架构为底座,深度融合物理引擎、图形渲染引擎与AI计算引擎,构建覆盖开发、仿真与训练的全栈式技术体系 [3][12] * 该平台通过高精度物理仿真与真实感渲染环境,加速具身智能模型在复杂真实世界场景中的学习与泛化能力,并与公司GPU算力、端云协同方案形成联动,为机器人、自动化与智能体等应用提供训练基础设施 [3][12] 公司战略定位 * 在国产GPU厂商中,摩尔线程是少数坚定走“全功能GPU”而非“单一AI加速器”路线的公司,未在AI浪潮中放弃图形与通用计算,这在长期生态与开发者黏性上具备更高上限,但同时意味着更高的研发与工程复杂度 [2][10]
上市后的摩尔线程,重心从造芯变成建生态
新浪财经· 2025-12-22 19:02
公司近期动态与市场定位 - 摩尔线程于2025年12月20日成功举办首届MUSA开发者大会,吸引了超过2000名产学研专业人士和开发者参与[1] - 公司于2025年12月5日正式登陆科创板,开盘市值达到3000亿元[1] - 此次大会是公司上市后的首场重要活动,旨在系统性展示其以自主MUSA统一架构为核心的全栈技术成果,回应市场对其如何支撑3000亿市值的关注[1] 核心战略:生态体系建设 - 公司创始人张建中强调,生态体系是GPU行业的核心护城河与价值所在,这一理念贯穿整个MDC 2025大会[2] - 公司将开发者置于生态建设的绝对中心,MUSA架构的全面升级均围绕降低开发与迁移成本、构建友好易用的开发环境展开[2] - 构建自主可控的软件生态被视为在全球市场挑战英伟达CUDA生态的关键突破口,兼容与创新并行是重要策略[4] - 公司正围绕硬件、算力、软件、终端工具与学习平台,构建以开发者为中心、覆盖全场景的MUSA生态体系[4] - 通过摩尔学院平台,公司已汇聚近20万名开发者和学习者,并通过教育共建行动覆盖全国200多所高校,吸引超过10万名青年学子参与[4] - 公司正在北京海淀区加速建设首个MUSA生态中心,作为核心运营基地与公共服务平台,并发布了MUSA开发者计划[6][7] 核心技术:MUSA架构演进与全功能GPU - MUSA是公司自主研发的元计算统一计算架构,也是国内首个单芯片支持AI智算、图形加速、科学计算、物理仿真及超高清视频编解码的全功能GPU架构[8] - 全功能GPU能处理多种任务并支持从FP4到FP64等多种计算精度,在工作效率、生态完整性与兼容性方面比普通GPU更具优势[9] - 自2022年发布至今,MUSA架构已升级至第五代,产品迭代迅速[11] - 2022年3月推出第一代GPU“苏堤”,同年11月推出第二代“春晓”,其现代图形渲染引擎性能最高提升3-5倍,AI计算加速引擎性能最高提升4倍,智能多媒体引擎性能最高提升4倍,物理仿真引擎性能最高提升2.5倍[11] - 2023年9月推出第三代GPU“曲院”,AI训练和推理能力相比前代提升3至5倍[11] - 2024年推出第四代GPU“平湖”,增加了FP8精度支持,可支撑面向DeepSeek类大模型预训练的万卡集群智算中心[11] MUSA 5.0 软件栈升级 - MUSA 5.0提供了一整套支持AI计算加速、图形计算、物理仿真与科学计算、智能多媒体及端侧智能的开发工具[12] - AI框架兼容PyTorch、Paddle,并新增对Jax和TensorFlow的支持[12] - 训练套件新增强化学习训练框架MT VeRL;推理套件新增对SGLang、VLLM和Ollama等新兴推理框架的适配[12] - MUSA SDK深度优化了计算和通信能力,提供了MATE算子库和MT DeepEP,新增对TileLang语言生态的兼容,并提供了用于AI与渲染快捷编程的muLang[13] - 发布了GPU中间表示语言MTX 1.0,以方便开发者深入调优GPU性能[13] - 图形计算方面集成了硬件级光线追踪引擎与自研AI生成式渲染,并计划后续完整支持DirectX 12 Ultimate[14] - 编程生态原生支持MUSA C,并兼容TileLang、Triton等语言[16] - 核心计算库muDNN在GEMM和FlashAttention上效率超过98%,通信效率达到97%,编译器性能提升3倍[16] - 开源生态方面,计算加速库、通信库和系统管理框架等核心组件将逐步向开发者社区开放[16] - 前沿特性方面,即将推出中间语言MTX、编程语言muLang、量子计算融合框架MUSA-Q以及计算光刻库muLitho[16] 新一代GPU架构“花港”与产品路线 - 公司发布了新一代全功能GPU架构“花港”,这是升级幅度最大的一代架构[16] - “花港”在计算密度、能效、精度支持、互联能力及图形技术等方面实现全面突破[17] - 计算性能方面,算力密度提升50%,支持从FP4到FP64的全精度端到端计算,新增MTFP6/MTFP4及混合低精度支持[19] - 编程与互联方面,集成新一代异步编程模型,并通过自研MTLink高速互联技术支持十万卡以上的智算集群扩展[19] - 图形与AI融合方面,内置AI生成式渲染引擎,增强硬件光线追踪能力,并完整支持DirectX 12 Ultimate[19] - 安全方面完全基于全栈自主研发,截至2025年6月30日,公司累计授权专利514项,其中发明专利468项,具备四层硬件安全架构[19] - 基于“花港”架构,公司公布了两款芯片技术路线:专注AI训推一体与超大规模智能计算的GPU“华山”,以及专攻高性能图形渲染的GPU“庐山”[20][21][23] - “庐山”实现了高性能图形计算的全面跨越:AI计算性能提升64倍,几何处理性能提升16倍,光线追踪性能提升50倍[25] - 搭载“华山”和“庐山”芯片的全新硬件产品将于明年亮相[25] 业务与市场前景 - GPU行业是强调长期主义的赛道,国际市场中英伟达凭借CUDA生态保持绝对领先,AMD紧随其后[1] - 在国产算力加速崛起和AI大模型需求爆发的背景下,国产GPU厂商站到了舞台中央[1] - 公司采取AI与图形双芯片路线组合拳,保持底层架构统一,为跨场景协同计算奠定基础[25] - 根据公司招股说明书,2025年上半年其AI智算和专业图形加速两项业务营收合计占比达99%,构成主要收入来源[25] - 公司认为,在GPU竞争愈发依赖软件与生态的背景下,开发者生态建设是更具现实意义的观察窗口,开发者社区的留存与使用是决定长期发展的关键变量[25]
摩尔线程的野心,不藏了
量子位· 2025-12-21 22:13
核心观点 - 摩尔线程在上市后迅速召开首届全功能GPU开发者大会,围绕其自主研发的MUSA架构,发布了一系列从云到端、从算力到生态的新产品与技术,标志着国产GPU能力进入新阶段[1][2][4] MUSA全功能GPU架构 - MUSA是公司自主研发的元计算统一系统架构,定义了从芯片设计到软件生态的统一技术标准,支持AI计算、图形渲染、物理仿真、科学计算及视频编解码等全场景高性能计算[6][7][10] - 发布第五代全功能GPU架构“花港”,在同等芯片面积下算力密度提升50%,计算能效提升10倍,并新增对FP4/FP6低精度计算及混合低精度端到端加速技术的支持,专为AI低比特训练与推理优化[8][13][17] - 花港架构原生支持矩阵rowmax计算以提升混合精度SIMT吞吐量,内置在线量化/反量化、随机舍入等硬件加速能力,为下一代Transformer引擎提供底层支撑[13] - 架构支持通过MTLink高速互联构建十万卡集群,为超大规模模型训练铺平道路[17] 软件栈与开发生态 - 同步推出MUSA软件栈5.0,构建从编译器、算子库到AI框架的全栈工具链,并宣布将逐步开源MATE算子库、MUTLASS、MT DeepEP通信库、KUAE云原生工具包等核心组件[16] - 软件生态广泛适配主流AI框架,除PyTorch、PaddlePaddle外新增对JAX、TensorFlow的支持,并新增强化学习训练框架MT VeRL[18] - 推理引擎深度优化自研MTT推理引擎与TensorX,同时适配SGLang、vLLM、Ollama等新兴推理框架[18] - 核心库muDNN实现GEMM/FlashAttention效率超98%,通信效率达97%,编译器性能提升3倍[18] - 推出面向AI+渲染融合的编程语言muLang,兼容TileLang、Triton,原生支持MUSA C,并发布GPU中间表示语言MTX 1.0以提升开发者调优自由度[18] - 公司打造“摩尔学院”作为开发者成长平台,截至2025年12月已汇聚20万名开发者,目标培育百万规模社群,并通过走进全国200所高校进行产教融合[59][61] 新产品发布:芯片 - 基于花港架构发布两款芯片路线:聚焦AI训推一体及高性能计算的GPU“华山”,以及专为图形计算而生的GPU“庐山”[21][22][28] - “华山”GPU全精度支持从FP4到FP64,具备MTFP4/MTFP6混合低精度加速能力,硬件级优化专为大模型训练定制,标志着公司正式具备支撑万亿参数大模型训练的能力[25][27] - “庐山”GPU引入AI生成式渲染架构和硬件光追引擎,支持DirectX 12 Ultimate,相比上一代产品AI计算性能提升64倍,3A游戏渲染性能提升15倍[30][31] - 首次推出面向端侧场景的智能SoC芯片“长江”,提供50 TOPS的异构AI算力,应用于具身智能、车载、AI计算终端等领域[32][34] 新产品发布:硬件与集群 - 基于长江芯片发布两款硬件:为AI学习与开发者打造的个人智算平台“MTT AIBOOK”,以及桌面高性能AI计算设备“AICube”[36][37][43] - MTT AIBOOK运行MT AIOS操作系统,预置完整AI开发环境,内置智能体“小麦”支持2K高清渲染、本地大模型及端侧ASR/TTS,并预装智源悟界Emu3.5多模态模型[37][40][42] - 发布“夸娥(KUAE 2.0)”万卡智算集群,在Dense大模型上的算力利用率达60%,在MOE大模型上达40%,有效训练时间占比超过90%[46][47] - 公司已完整复现DeepSeek V3的FP8训练,自研FP8 GEMM算力利用率高达90%[47] - 前瞻性披露下一代高密硬件基石“MTT C256超节点”,采用计算与交换一体化设计以提升万卡集群的能效比和训练效能[49][50] 性能验证与行业意义 - 公司与硅基流动合作,在MTT S5000 GPU上成功完成对DeepSeek V3 671B满血版大模型的深度适配与性能验证[53] - 在FP8低精度推理技术加持下,MTT S5000单卡实测Prefill吞吐突破4000 tokens/s,Decode吞吐超1000 tokens/s,创下当前国产GPU在大模型推理场景下的新高[53] - 这一成果表明,在成熟软件工程体系协同优化下,国产算力硬件正从“能跑”迈向“跑得快、跑得稳、跑得值”,单位算力有效利用率成为关键落地指标[54][55] - MUSA架构的创新不仅是对下一代AI基础设施的系统性回答,更是对未来AI产业格局的一次主动定义,使其成为多模态智能、具身智能及物理AI时代的关键使能平台[16][19]
全新架构、万卡集群、智算平台,摩尔线程(688795.SH)开发者大会还有哪些亮点?
智通财经网· 2025-12-21 07:23
核心观点 - 摩尔线程在首届开发者大会上发布了新一代全功能GPU架构“花港”及一系列软硬件产品,展示了其在AI训推、图形渲染、智算集群及个人终端等领域的全栈布局,战略意图从硬件供应商转向平台级算力基础设施商 [1][8][9] 技术架构与芯片发布 - 发布新一代全功能GPU架构“花港”,算力密度较上一代提升50%,能效提升10倍,支持从FP4到FP64全精度,集成AI生成式渲染架构(AGR)和第二代光线追踪硬件加速引擎,计划明年量产 [1] - 基于“花港”架构公布两款核心芯片:“华山”主打AI训推一体和超智融合,内置新一代异步编程模型和全精度MMA,配备MTFP8/6/4混合低精度计算技术 [2] - 另一款芯片“庐山”专攻高性能图形渲染,AI计算性能较前代提升64倍,几何处理性能提升16倍,完整支持DirectX 12 Ultimate [2] 智算中心与集群能力 - 发布“夸娥”万卡智算集群,浮点运算能力达10 Exa-Flops,在Dense大模型上的训练算力利用率(MFU)达60%,在MOE大模型上为40%,有效训练时间占比超90% [4] - 展示与硅基流动的合作成果,在DeepSeek R1 671B全量模型上,MTT S5000单卡的Prefill吞吐量突破4000 tokens/s,Decode吞吐量突破1000 tokens/s [5] - 分享面向下一代智算中心的MTT C256超节点架构规划,旨在通过高密硬件设计提升集群能效 [5] 软件生态与开发者工具 - 自研MUSA架构升级至5.0版本,核心计算库muDNN的GEMM/FlashAttention效率超98%,通信效率达97% [6] - 计划逐步向开发者社区开源计算加速库、通信库及系统管理框架的核心组件 [6] - 计划推出兼容跨代GPU指令架构的中间语言MTX,以及面向渲染与AI融合计算的编程语言muLang,以降低开发者适配门槛 [6] 个人智算终端硬件 - 正式进军个人智算终端硬件领域,发布首款AI算力本MTT AIBOOK,售价9999元(32GB+1TB版本),预计2026年1月10日开售 [7] - MTT AIBOOK搭载自研智能SoC芯片“长江”,集成高性能全大核CPU及全功能GPU,异构AI算力达50 TOPS,内置AI智能体和2D数字人“小麦”,支持0.5秒生成数字人形象,并预装Qwen3-8B大模型 [7][8] - 该设备支持Windows、Linux、安卓容器及所有国产操作系统,旨在将MUSA生态从云端下沉到开发者桌面端,实现开发闭环 [8] 行业背景与战略意图 - 行业正处于从追求参数规模向追求推理效能和生态落地的转型期 [9] - 公司展示的“芯-边-端-云”全栈体系,反映出其试图摆脱单一硬件供应商身份,转向平台级算力基础设施商的战略意图 [9] - 中国工程院院士郑纬民指出,发展“主权AI”的核心在于算力自主、算法自强与生态自立,并强调国产芯片平台必须构建易用的开发环境以留住开发者社群 [8] 资本市场表现 - 公司股价近期波动明显,12月19日收报664.10元/股,跌幅5.9%,相较于12月11日高点累计跌幅达29.4% [9] - 相较于发行价,当前股价涨幅仍超过481%,公司总市值维持在3121.46亿元的高位 [9]
摩尔线程亮出全栈技术底牌:“花港”新架构与万卡集群冲击高端GPU市场格局
环球网· 2025-12-20 15:00
核心观点 - 摩尔线程在首届MUSA开发者大会上,系统展示了其在全功能GPU领域从架构创新、集群能力到生态建设的全面突破,标志着公司从单一场景加速卡产品向覆盖AI计算、图形渲染、科学计算等全场景的“全功能GPU”平台迈进 [1][5] - 国产高端算力发展正从单点芯片的“从无到有”,进入需要攻克超大规模系统工程、构建繁荣应用生态的“深水区” [11] 架构创新 - 新一代全功能GPU架构“花港”亮相,在计算密度上提升50%,效能提升最高达10倍,并完整支持从FP4到FP64的全精度计算 [3] - “花港”架构集成了自研的MTLink高速互联技术,为十万卡规模以上的集群扩展提供了底层支持 [3] - 基于“花港”架构,公司规划两款芯片:专注于AI训练与推理一体化的“华山”,以及瞄准高性能图形渲染的“庐山” [5] - “庐山”芯片在图形性能上宣称实现数量级提升,AI计算、几何处理及光线追踪性能分别提升64倍、16倍和50倍 [5] 集群能力 - 首次系统披露了“夸娥”万卡智算集群的关键工程效率指标,成为国内少数公开万卡级实际训练效率的厂商之一 [6] - 该万卡集群在训练稠密大模型时,模型算力利用率达到60%,训练混合专家模型时模型算力利用率为40%,训练线性扩展效率达95%,有效训练时间占比超过90% [6] - 在推理侧,联合硅基流动在DeepSeek R1 671B全量模型上实现性能突破,经优化后,MTT S5000单卡在Prefill阶段吞吐量突破4000 tokens/s,Decode阶段突破1000 tokens/s [7] 生态建设 - 自主统一的软件架构MUSA已迭代至5.0版本,并计划逐步开源包括计算加速库、通信库及系统管理框架在内的核心组件 [8] - 发布了搭载自研“长江”智能SoC的AI算力本MTT AIBOOK,提供端侧50TOPS算力,旨在实现从芯片到开发环境的全栈整合与“开箱即用” [8] - 面向开发者的“摩尔学院”平台已汇聚近20万学习者,并通过校企合作覆盖全国超200所高校 [9] 技术融合与前沿探索 - 基于“花港”架构实现了硬件级光线追踪加速,并推出了自研的AI生成式渲染技术MTAGR 1.0 [10] - 已在具身智能、科学智能、AI for 6G等前沿交叉领域展开布局,发布了具身智能仿真训练平台MT Lambda及相应的机器人解决方案 [10]
摩尔线程股价5天涨7倍居A股第三 押注全功能GPU前九月投8.6亿研发
长江商报· 2025-12-12 07:41
公司股价表现与市场热度 - 上市仅5个交易日后,股价收报941.08元/股,较发行价114.28元/股上涨723.49%,成为A股第三高价股,仅次于贵州茅台和寒武纪 [2] - 上市首日股价收报600.50元/股,较发行价上涨425.46%,随后在12月10日和11日分别大涨16.98%和28.04%,股价接连突破800元和900元关口 [6] - 截至2025年12月11日,公司市值达到4423亿元,较IPO发行前的估值298.45亿元增长近14倍 [7] - IPO发行7000万股,发行价114.28元/股,募资80亿元,发行后总股本4.70亿股,发行后估值达537.15亿元 [3] - 新股申购有效申购股数达462.17亿股,网上中签率仅为0.03635%,显示市场资金追捧 [4] 公司财务与经营状况 - 2025年前三季度,公司实现营业收入7.85亿元,同比增长181.99% [2][11] - 2025年前三季度,公司归母净利润为-7.24亿元,较上年同期减亏18.71% [2] - 2025年前三季度,公司研发投入为8.61亿元,仍处于高投入期 [2][11] - 公司发布风险提示公告称,新产品和新架构均处于在研阶段,量产及产生收入仍需一定时间 [2] 公司业务与技术定位 - 公司是“国产GPU第一股”,主要从事GPU及相关产品的研发、设计和销售,被视为国产芯片的重要力量 [9] - 公司押注全功能GPU,基于自研的MUSA架构,率先实现了在单芯片上同时支持AI计算、图形渲染、物理仿真及视频处理的能力 [2] - 公司核心竞争力在于“全功能GPU”定位,与单纯聚焦AI加速的国产厂商不同,致力于为AI、数字孪生、科学计算等高性能计算领域提供计算加速平台 [9][10] - 公司已成功推出四代GPU架构,产品线覆盖政务与企业级智能计算、数据中心及消费级终端市场 [9] 市场预期与行业背景 - 市场认为寒武纪股价崛起点燃了A股对国产硬科技企业的资本信心,摩尔线程的行情被视为A股硬核科技行情的延续 [2] - 市场预期公司正试图通过持续技术迭代,在由英伟达等巨头主导的全球市场中,为中国算力产业打开突破口 [10] - 公司计划于12月19日至20日举办首届MUSA开发者大会,创始人将系统阐述以MUSA为核心的全栈发展战略,并发布新一代GPU架构 [11] 早期投资者收益 - 以早期投资者沛县乾曜兴科技合伙企业为例,其在2020年首轮融资中投资190万元,IPO发行前持有1699.87万股(占4.25%) [7] - 按12月11日收盘价941.08元/股计算,该早期投资者持股市值约为159.97亿元,浮盈159.95亿元,收益率达8418倍 [7]
科创板迎来国产全功能GPU龙头 摩尔线程成功上市
上海证券报· 2025-12-05 20:17
公司上市里程碑 - 摩尔线程于12月5日正式在上海证券交易所科创板挂牌上市,成为中国首家登陆A股市场的全功能GPU企业 [2] - 公司创业五年即成功上市,是其发展的关键里程碑,也标志着中国算力发展进入新阶段 [2] 上市首日市场表现 - 上市首日开盘价报650元/股,较发行价高开468.78% [4] - 盘中最高价达到688元/股,按开盘价计算,中一签(500股)盈利超过26.7万元 [4] - 截至收盘,股价为650元/股,涨幅468.78%,成交金额为14.53亿元,换手率为7.61% [5] 公司技术与产品布局 - 公司坚持自主研发MUSA统一系统架构,在同一颗芯片上同时支持AI计算加速、图形渲染、物理仿真与科学计算、超高清视频处理 [6] - 历经五年,已成功推出四代GPU架构,完成五颗芯片的量产,形成了从芯片到集群、覆盖云边端的全栈产品布局 [9] - 解决方案已应用于政务、企业、数据中心及消费终端等多个领域,服务于大模型、数字孪生、物理AI等前沿场景 [9] - 公司打造的夸娥(KUAE)智算集群支持万卡级规模扩展,旨在构建万P级浮点运算能力的国产通用加速计算平台 [11] - 在消费市场,推出了国内首张国产游戏显卡MTT S80,可流畅运行《黑神话:悟空》等顶级3A游戏 [11] - 基于MUSA架构,公司率先发布支持DirectX 12的图形加速引擎,全面兼容OpenGL、Vulkan等主流生态,并实现对多操作系统与CPU平台的无缝适配 [12] 财务与研发数据 - 2022年至2025年6月,公司累计研发投入超过43亿元,研发人员占比达77%以上 [12] - 2022年至2024年间,公司营业收入年复合增长率高达208.44% [12] - 2025年上半年,公司实现营收7.02亿元,已超越过去三年总和 [12] - 2025年上半年,AI智算业务贡献营收占比94.73%,公司毛利率提升至69.14% [12] 行业背景与战略意义 - GPU作为人工智能革命与数字经济发展的核心算力引擎,已成为我国在全球算力竞争中必争的战略高地 [11] - 在全球科技竞争背景下,算力即国力,先进AI算力是关乎国家发展主动权的关键战略资源 [11] - 公司上市是上交所科创板“1+6”政策体系增强资本市场制度包容性、服务硬科技企业的直接成果 [9] - 公司上市体现了中国在半导体产业关键环节加速实现自主可控的决心与步伐 [9] 未来发展计划 - 本次发行募资将重点投向新一代自主可控AI训推一体芯片、图形芯片及AI SoC芯片的研发 [20] - 旨在巩固并扩大公司在AI算力与图形计算领域的技术领先优势,构建更完善、更具国际竞争力的自主产品体系 [20] 外部支持与合作 - 中信证券作为中介机构,参与了公司上市过程 [9] - 浦发银行北京分行于2024年为公司发放数亿元“浦研贷”中长期贷款,并为国产全功能GPU万卡通用智算集群攻关项目提供金融支持 [17] - 北京市海淀区作为北京国际科技创新中心的核心区,正全力打造人工智能产业高地,将为公司提供广阔舞台 [16] - 上海证券交易所表示将持续做好“三开门”工作,加快落地科创板“1+6”政策举措,坚守“硬科技”定位 [16]