花港架构
搜索文档
首届开发者大会,让摩尔线程全功能GPU的独特优势更「具像化」
雷峰网· 2025-12-26 08:25
公司近期动态与成果展示 - 摩尔线程于北京举办首届开发者大会(MDC),1000平方米展区汇聚上千位开发者,集中展示了智能机器人、数字人、Agent、AI for Science及气象预测等前沿技术应用 [2] - 展区中央的数字文娱与视频多媒体区展示了由国产GPU驱动的eVTOL全动飞行模拟器、经典拳皇及3A大作游戏,突显了公司全功能GPU同时具备图形能力的稀缺性 [2] - 展区一次性展示了近百个应用案例,覆盖从消费到垂直行业、从图形到AI再到高性能计算的广泛应用,直观呈现了全功能GPU的能力边界与公司成立五年来的成果 [2][3][15] 全功能GPU的战略价值与技术特性 - 全功能GPU需同时支持完整的图形流水线、张量计算核心以支持AI,以及高精度浮点单元以满足高性能计算,这是其核心“奥义” [5] - 公司全功能GPU内置多种计算引擎,涵盖AI计算、3D图形渲染、物理仿真与科学计算,以及超高清视频编解码,实现了“AI+3D图形+高性能计算”于一颗芯片 [7] - 全功能GPU的应用广度相较传统GPGPU呈现出明显量级差异,同一架构下不同型号的GPU可同时承担图形、AI与计算任务 [15] 图形与视频处理能力的具体表现 - 自2022年11月发布消费级显卡MTT S80起,公司几乎每30天更新一次驱动,已实现对China Top 50热门游戏的100%兼容,并对其中44款完成专项优化 [9] - 公司的端侧实时视频超分技术MTVSR可实现2–4倍实时超分效果,同时降低视频存储和传输成本 [11] - 基于MTT X300的国产视景系统——微视威eVTOL全动飞行模拟器已通过中国民航局5级鉴定,首次打通全国产化视景渲染链路 [11] AI计算与高性能计算的应用突破 - 在智慧医疗领域,合作伙伴基于MTT S4000将AI推理、三维重建与高性能渲染整合,将二维医学影像实时转化为三维模型,通过XR设备呈现 [11] - 在智算场景,公司通过KUAE集群的零中断容错方案实现大规模训练全程不中断 [11] - 在推理侧,与合作伙伴对MTT S5000进行深度优化,在DeepSeek 671B全量模型的实际推理中,MTT S5000单卡Prefill吞吐突破4000 tokens/s,Decode吞吐突破1000 tokens/s [11] 多领域应用案例的广泛覆盖 - 在具身智能赛道,合作伙伴的VR遥操作机器人系统已与MTT E300 AI模组适配,并与MTT S80协同工作,实现高风险环境下的精细作业 [13] - 在AI推理市场,多家合作伙伴基于公司全功能GPU推出多款AI Box,将算力延伸至具身智能、Agent、制造、办公、交通、教育和医疗等场景 [15] - 在科学计算领域,公司联合北京大学课题组打造软硬件协同的生命科学解决方案,并在CAD、工业设计与专业可视化领域,国产工作站方案正逐步投入使用 [15] 芯片架构的快速迭代与新品发布 - 公司自成立之初便选择全功能GPU路线,自2022年量产第一代架构苏堤以来,以一年一代的速度快速迭代,相继发布了春晓、曲院、平湖架构 [18] - 每代架构都推出满足不同市场需求的产品,例如S80为首款国产消费级显卡,S4000为首个训推一体AI集成卡并组建千卡集群,S5000构建万卡集群支撑万亿参数大模型训练 [20] - 公司计划于2026年推出基于全新指令集的下一代架构——花港,旨在国产工艺发展相对缓慢时提升算力密度,通过全新指令集将算力密度提升50%,并通过精心打磨架构将效能提升10倍 [20] 新一代花港架构及芯片性能详解 - 基于花港架构,公司推出两款新品:AI训推一体芯片华山和专业图形图像计算芯片庐山 [22] - 华山是一款高性能AI推理与训练芯片,其浮点计算性能位于业界最领先的两款GPU之间,访存带宽和高速互联同时提升,结合异步编程技术实现高效线程同步等,综合性能极具竞争力 [22] - 华山的新一代TensorCore支持从FP4到FP64的全精度计算,并对FP8、FP6和FP4等低精度单元进行了优化,同时开放支持多种类的以太协议,不仅支持MTLink 4.0,还支持国内合作伙伴的以太网协议,充分兼容不同硬件生态 [25] - 得益于新一代Scale-up系统,华山的能力能够实现1024个GPU的超节点,公司发布了MTT C256超节点的架构规划 [27] - 庐山作为花港架构专业图形计算产品,相比S80,游戏性能提升15倍,AI计算性能提升64倍,几何处理提升16倍,光线追踪提升50倍,并显著增强纹理填充、原子访存能力及显存容量 [29] - 截至2025年6月30日,公司累计授权专利514项,其中发明专利468项,为性能跃升提供了技术和专利积累 [31] MUSA软件生态的战略与进展 - MUSA是公司自主研发的元计算统一系统架构,覆盖从芯片架构、指令集、编程模型到软件运行库及驱动程序框架等的全栈技术体系 [33] - 决定主权AI成败的关键在于是否有足够多的开发者愿意长期在这套栈上写代码,开发者是生态的核心 [35] - 构建生态的思路在于包容和兼容,包容意味着涵盖多条技术路线,兼容意味着不必打造完全不同的生态 [37] - MUSA软件栈在编程模型、方式和加速库功能上与国际主流高度一致,以降低开发者学习成本,并通过更高级抽象的DSL领域专业编程语言以及与开发者深度融合实现软硬件协同设计来寻求突破 [38] MUSA 5.0的关键升级与开发工具 - MUSA 5.0在全栈统一性、极致效能和生态开放性上取得关键突破 [39] - 编程生态升级:原生MUSA C,深度兼容 TileLang、Triton 等编程语言,为开发者提供灵活高效的全栈开发体验 [42] - 计算效能优化:核心计算库muDNN实现GEMM/FlashAttention效率超98%,通信效率达97%,编译器性能提升3倍,并集成高性能算子库,显著加速训练与推理全流程 [42] - 开源生态扩大:计划逐步开源计算加速库、通信库及系统管理框架在内的核心组件,向开发者社区开放深度优化的底层能力 [42] - 前沿特性拓展:即将推出兼容跨代GPU指令架构的中间语言MTX、面向渲染+AI融合计算的编程语言muLang、量子计算融合框架MUSA-Q,以及计算光刻库muLitho [42] - 公司推出了搭载长江智能SoC的AIBOOK,新一代长江AI SoC集成多种处理单元,提供高达50TOPS端侧AI算力,内置1TB SSD、32G/64G高速存储,预装Linux内核AIOS系统及开发工具,支持主流操作系统,实现“开箱即用” [43] - 基于长江SoC的迷你型计算设备MTT AICube也将推出,公司还将推出面向前沿领域的完整方案,如端云一体化具身智能方案MT Robot,帮助开发者缩短产品上市周期 [45] 开发者生态建设与公司价值展望 - 目前,摩尔学院用户总量已经达到了20万,公司的目标是拥有百万级的MUSA开发者 [47] - 全功能GPU决定了公司能够探索的应用广度,包括图形渲染、AI与高性能计算,而MUSA生态的繁荣程度则决定了在各个市场的应用厚度和不可替代性,广度与厚度的乘积是支撑公司千亿价值的基石 [49] - 从首届开发者大会的近百个应用案例,到MUSA生态与花港架构的落地,公司正以完整技术体系和开放生态将潜力转化为切实价值 [50]
技术突围与资本共振: 人工智能赛道涌现上市潮
中国证券报· 2025-12-23 04:37
行业资本化进程 - 2025年末,智谱、MiniMax两家国产AI大模型企业通过港股聆讯,争夺“大模型第一股” [1] - 国产GPU“四小龙”中,摩尔线程、沐曦股份已在科创板上市,壁仞科技、天数智芯则启动港股上市 [1] - 相关企业呈现营收高速增长、研发投入巨大、利润持续亏损的财务特征 [1] - 登陆资本市场将助力企业加速技术迭代和市场推广 [3] 核心公司概况与市场地位 - 智谱成立于2019年,截至2025年11月,其大模型赋能全球12000家企业客户、逾8000万台终端设备及超4500万名开发者 [2] - 按2024年收入计,智谱在中国独立通用大模型开发商中位列第一,市场份额为6.6% [2] - MiniMax成立于2022年初,截至2025年9月30日,拥有超过200个国家及地区的逾2.12亿名个人用户以及超过100个国家的13万企业客户 [2] - MiniMax超70%收入来自海外,2024年营收增长782.2%至3052万美元,2025年前9个月营收达5344万美元,同比增长175% [5] - 摩尔线程市值超过3000亿元,沐曦股份市值超过2800亿元 [2] 技术进展与产品发布 - 摩尔线程发布下一代全功能GPU架构“花港”,基于该架构将推出“华山”与“庐山”芯片 [3] - 新架构在相同工艺下算力密度提升50%,效能提升10倍,支持十万卡以上规模智算集群扩展 [3] - 人工智能大模型调用量陡峭式增长,截至2025年6月底,我国日均Token消耗量突破30万亿,一年半时间增长300多倍 [4] - 截至2025年12月,字节跳动豆包大模型日均Token消耗量突破50万亿 [5] 市场规模与增长预测 - 2024年,我国人工智能核心产业规模超过9000亿元,增速达24%,2025年有望超过1.2万亿元 [1] - 2026年全球人工智能市场规模有望达到9000亿美元 [6] - 预计2026年我国人工智能市场规模增长率会超过30% [6] - 2022年至2024年,智谱营业收入分别为5740万元、1.245亿元、3.124亿元,年复合增长率达130% [5] 行业应用现状与特征 - AI应用加速,AI眼镜、人形机器人、AI手机等原生人工智能终端层出不穷 [4] - 在生产端,人工智能体在工业、能源、医疗等场景涌现大量落地案例 [4] - 人工智能需求旺盛,阿里云AI服务器上架节奏跟不上订单增长,积压订单持续扩大 [5] - 大模型在工业场景应用呈“微笑曲线”态势,研发设计与营销服务环节更易获得AI赋能 [7] - 2025年生产制造环节案例占比从19.9%增长至25.9%,AI正向价值创造核心环节渗透 [7] 面临的挑战与制约因素 - 人工智能应用存在高成本、低收益的矛盾点 [1][8] - 工业数据碎片化问题突出,共享不足,缺乏行业通识数据集 [7] - 大模型对数据、算力消耗高昂,商业回报路径仍不明确 [8] - AI投资处于“规模不经济”阶段,边际效率可能降低而成本未见下降 [8] - 高质量数据集稀缺,制约了模型性能的持续优化与规模化推广 [8]
摩尔线程,走英伟达的路,也走自己的路
钛媒体APP· 2025-12-22 09:37
公司战略定位与核心趋势 - 摩尔线程在MDC 2025大会上传递的核心趋势是,国产GPU公司正像真正的基础设施公司那样思考问题,而不仅仅是追求性能追赶 [2] - 公司被视为“中国版英伟达”,其创始人及团队拥有深厚的英伟达背景,公司行事风格与产品思路(如全功能GPU、开发者大会对标GTC)均与英伟达相似 [2] - 摩尔线程并非简单复刻英伟达,而是在用英伟达的方法论,结合中国面临的供应链不确定性、技术封锁和国产生态薄弱等独特产业条件,解决中国自己的算力问题 [3] - 公司的能力已从单卡扩展到万卡集群,关注点从追求性能转向追求稳定性、线性度和MFU等系统级指标,标志着向算力基础设施公司的转变 [3] 全功能GPU的战略意义与技术演进 - 公司坚持发展全功能GPU,其创新被视为一部算力进化史,GPU的计算边界从早期图形渲染持续拓展至通用并行计算、AI和科学计算 [5] - 未来五至十年的关键应用形态将集中在具身智能领域,这需要算力平台同时具备计算、仿真、图形与感知能力,单一功能加速器无法胜任 [5] - “3D + AI + HPC”的组合是全功能GPU自然演进的结果,使其成为支撑新一代科技发展的核心基础设施 [6] - 全功能GPU集成了四类核心计算引擎:AI计算引擎、3D图形渲染引擎、高性能计算与物理仿真引擎、智能视频编解码引擎,以统一支撑多样化计算需求 [6][7] MUSA统一计算架构与软件生态 - MUSA是公司自主研发的元计算统一计算架构,覆盖从芯片架构、指令集、编程模型到软件运行库的全栈技术体系,被视为公司的“第一产品” [7] - 一个完整的MUSA架构底层是全功能GPU,之上是硬件系统(如夸娥智算集群),再之上是包括加速库、调试工具和应用案例的全套软件栈 [7][8] - MUSA 5.0标志着架构步入成熟,原生MUSA C深度兼容TileLang、Triton,核心计算库muDNN的GEMM/FlashAttention效率超98%,通信效率达97%,编译器性能提升3倍 [10] - 公司计划逐步开源计算加速库、通信库及系统管理框架等核心组件,并推出MTX中间语言、muLang编程语言、MUSA-Q量子计算融合框架和muLitho计算光刻库 [10] - MUSA统一软件栈能够支持国际和国产的CPU系统及开发环境,覆盖“云边端”全系列产品,用同一套软件支撑不同硬件 [11] 新一代“花港”架构与芯片产品路线 - 公司发布了新一代全功能GPU架构“花港”,在计算密度、能效、精度支持、互联能力及图形技术等方面实现全面突破 [11] - “花港”架构核心特性包括:算力密度提升50%,支持从FP4到FP64的全精度计算,新增MTFP6/MTFP4及混合低精度支持 [11] - 架构集成新一代异步编程模型,并通过自研MTLink高速互联技术支持十万卡以上规模智算集群扩展 [11] - 架构内置AI生成式渲染架构,增强硬件光线追踪,完整支持DirectX 12 Ultimate,实现图形与AI深度融合 [12] - 架构基于全栈自研,具备安全可信能力,截至2025年6月30日,公司累计授权专利514项,其中发明专利468项 [12] - 基于“花港”架构,公司公布了两款未来芯片技术路线:“华山”专注AI训推一体与超大规模智能计算;“庐山”专攻高性能图形渲染 [12][14] - “庐山”图形芯片相比前代实现显著性能跨越:AI计算性能提升64倍,几何处理性能提升16倍,光线追踪性能提升50倍 [14] 夸娥智算集群与系统级能力 - 公司正式发布了夸娥万卡智算集群,具备全精度、全功能通用计算能力 [15] - 该万卡集群浮点运算能力达到10 Exa-Flops,在Dense大模型上训练算力利用率达60%,在MOE大模型上达40%,有效训练时间占比超90%,训练线性扩展效率达95% [15] - 在训练侧,基于原生FP8能力完整复现顶尖大模型训练流程,并在多项关键精度指标上达到国际主流水平,Flash Attention算力利用率超95% [15] - 在推理侧,经过与硅基流动的联合优化,在DeepSeek R1 671B全量模型上,MTT S5000单卡实现Prefill吞吐突破4000 tokens/s、Decode吞吐突破1000 tokens/s [15] - 公司发布了MTT C256超节点的架构规划,采用计算与交换一体化的高密设计,旨在为下一代超大规模智算中心构建硬件基石 [16]
中国机器人在格斗机器人大赛中夺冠;摩尔线程发布新一代GPU架构|周末要闻速递
21世纪经济报道· 2025-12-21 17:50
宏观经济与政策动向 - 国务院常务会议强调各部门需统一思想行动,全面贯彻2026年经济工作总体要求与政策取向,加快制定具体实施方案以推动工作落地见效 [2] - 财政部与工信部要求各地区部门科学制定政府采购领域本国产品的具体标准要求,并加强监管 [3] - 国家发改委、市场监管总局、国家网信办联合发布《互联网平台价格行为规则》,禁止平台强制或变相强制平台内经营者降价、让利或开通自动跟价系统,该规则将于2026年4月10日起施行 [4] - 商务部党组扩大会议部署2026年工作重点,包括大力提振消费、释放服务消费潜力、推动贸易创新发展、发展数字与绿色贸易、深化制度型开放、优化自贸区布局及引导产业链供应链跨境布局 [5] - 市场监管总局修改《禁止垄断协议规定》,对纵向垄断协议设定豁免门槛,涉及价格固定的协议在相关市场份额低于5%且营业额低于1亿元时不予禁止,非价格类纵向限制协议在市场份额低于15%时可豁免,新规2026年2月1日施行 [7] 科技与产业突破 - 长安汽车获得国内首块L3级自动驾驶专用正式号牌,标志着其开启L3级自动驾驶时代 [8][9] - 摩尔线程发布下一代全功能GPU架构“花港”,在相同工艺下算力密度提升50%,效能提升10倍,可支持十万卡以上规模的智算集群扩展 [10] - 三星电子发布全球首款采用2纳米GAA工艺打造的智能手机SoC Exynos 2600 [11] - 中国俱乐部自主设计制造的机器人“深海巨鲨3”在阿联酋举行的未来运动会格斗机器人大赛中夺冠 [13] - 世界贸易组织报告指出,在配套政策到位情况下,人工智能到2040年有望将跨境货物和服务贸易额提高34%至37%,并推动全球GDP增长12%至13% [14] - 第五届脑科学前沿与产业大会暨2025深圳脑机接口与人机交互技术博览会将于12月28日至30日举行 [21] 资本市场与公司动态 - 国家网信办会同证监会依法处置一批炮制涉资本市场谣言、非法荐股的网络账号,如“天津股侠”、“投行那些事儿”等 [6] - 中国神华公告拟以1335.98亿元交易价格,通过发行股份及支付现金方式购买国家能源集团及其子公司持有的多项资产,包括多家电力、能源、煤炭、化工、运输公司股权 [12] - 有消息称字节跳动2025年全年利润有望达约500亿美元,但接近公司的知情人士回应称该数据及前三季度约400亿美元净利润的数据均不实且偏差较大 [13] - 未来一周重要市场事件包括中国12月LPR报价、中国11月工业经济效益报告、美国及英国9月GDP数据、多国CPI及耐用品订单数据发布,以及多场行业发布会与大会 [16][17][18][19][20][21][22] 券商策略观点 - 中信建投继续看好AI算力板块,认为大模型迭代持续带来旺盛算力需求,并建议重视国内产业链公司,因前期调整较多且国产GPU能力提升及H200放开有望加速国内AI算力基础设施部署 [24] - 银河证券指出A股短期延续震荡,元旦前后或出现“小躁动”行情,建议2026年关注新质生产力领域(如人工智能、具身智能、新能源等)及反内卷政策下制造业与资源板块的盈利修复机会 [25]
中国机器人在格斗机器人大赛中夺冠;摩尔线程发布新一代GPU架构|周末要闻速递
21世纪经济报道· 2025-12-21 16:57
宏观经济与政策导向 - 国务院常务会议强调各部门需统一思想行动,全面贯彻明年经济工作总体要求和政策取向,加快制定具体实施方案以推动工作落地见效 [1] - 商务部2026年工作重点包括大力提振消费、扩大优质商品服务供给、释放服务消费潜力,并推动贸易创新发展、推进贸易投资一体化与内外贸一体化 [4] - 商务部计划稳步推进制度型开放,有序扩大服务领域自主开放,深化外商投资促进体制机制改革,优化自贸试验区布局以塑造吸引外资新优势 [4] 产业与市场监管 - 财政部与工信部要求各地区各部门科学制定政府采购领域本国产品的具体标准要求,并加强对政策实施的监管 [2] - 国家发改委、市场监管总局、国家网信办联合发布《互联网平台价格行为规则》,禁止平台强制或变相强制平台内经营者降价、让利或开通自动跟价系统,该规则自2026年4月10日起施行 [3] - 市场监管总局修改《禁止垄断协议规定》,对纵向垄断协议设定豁免门槛:涉及价格固定的协议,相关市场份额低于5%且营业额低于1亿元可豁免;涉及其他非价格类纵向限制,相关市场份额低于15%即可豁免,新规2026年2月1日施行 [6] - 国家网信办会同证监会处置一批涉资本市场不实信息的账号,包括“天津股侠”等,这些账号涉及散布监管谣言、炒作股市、非法荐股等行为 [5] 科技创新与产业突破 - 长安汽车获得由重庆市公安局交通管理总队授予的首块L3级自动驾驶专用正式号牌“渝AD0001Z”,标志着公司开启L3级自动驾驶时代 [7] - 摩尔线程发布下一代全功能GPU架构“花港”,在相同工艺条件下,新架构算力密度提升50%,效能提升10倍,可支持十万卡以上规模智算集群 [8] - 三星电子发布全球首款采用2纳米GAA工艺打造的智能手机SoC Exynos 2600 [9] - 中国俱乐部自主设计制造的机器人“深海巨鲨3”在阿联酋阿布扎比举行的第二届未来运动会格斗机器人大赛中夺冠 [11] 公司动态与资本运作 - 中国神华公告拟通过发行A股及支付现金方式,购买国家能源集团及其全资子公司西部能源持有的多项资产,交易价格1335.98亿元,同时拟向不超过35名特定投资者发行A股募集配套资金 [10] - 有消息称字节跳动2025年前三季度累计净利润约400亿美元,全年利润有望达约500亿美元,但接近公司的知情人士回应称相关数据不实且偏差较大 [11] 国际贸易与科技趋势 - 世界贸易组织发布《2025年世界贸易报告》指出,在配套政策到位情况下,人工智能到2040年有望将跨境货物和服务贸易额提高34%至37%,全球GDP增长12%至13% [12] - 商务部2026年工作规划包括鼓励支持服务出口,积极发展数字贸易、绿色贸易,推动共建“一带一路”高质量发展,并推动商签更多区域和双边贸易投资协定 [4]
全新架构、万卡集群、智算平台 摩尔线程开发者大会还有哪些亮点?
中金在线· 2025-12-21 15:42
核心观点 - 摩尔线程在首届开发者大会上发布了新一代全功能GPU架构“花港”及两款核心芯片,展示了其在AI训练、推理及图形渲染领域的性能突破,并宣布进军个人智算终端,标志着公司正从硬件供应商向平台级算力基础设施商转型 [1][2][10] 技术架构与芯片发布 - 发布新一代全功能GPU架构“花港”,算力密度较上一代提升50%,能效提升10倍,支持从FP4到FP64全精度,集成AI生成式渲染架构和第二代光线追踪硬件加速引擎,计划明年量产 [1][2] - 基于“花港”架构公布两款核心芯片:“华山”主打AI训推一体和超智融合,内置新一代异步编程模型和全精度MMA,配备MTFP8/6/4混合低精度计算技术 [3] - 另一款芯片“庐山”专攻高性能图形渲染,AI计算性能较前代提升64倍,几何处理性能提升16倍,完整支持DirectX 12 Ultimate [3] 智算中心与集群性能 - 发布“夸娥”万卡智算集群,浮点运算能力达10 Exa-Flops,在Dense大模型上训练算力利用率达60%,在MOE大模型上为40%,有效训练时间占比超90% [5] - 展示推理性能突破:与硅基流动合作,在DeepSeek R1 671B全量模型上,MTT S5000单卡Prefill吞吐量突破4000 tokens/s,Decode吞吐量突破1000 tokens/s [6] - 分享面向下一代智算中心的MTT C256超节点架构规划,旨在通过高密硬件设计提升集群能效 [6] 软件生态与开发者工具 - 自研MUSA架构升级至5.0版本,核心计算库muDNN的GEMM/FlashAttention效率超98%,通信效率达97% [7] - 宣布开源计划,将逐步向开发者社区开放计算加速库、通信库及系统管理框架的核心组件 [7] - 计划推出兼容跨代GPU指令架构的中间语言MTX,以及面向渲染与AI融合计算的编程语言muLang,以降低开发适配门槛 [7] 个人智算终端与市场战略 - 正式进军个人智算终端硬件领域,发布首款AI算力本MTT AIBOOK,售价9999元(32GB+1TB版本),预计2026年1月10日开售 [8][9] - MTT AIBOOK搭载自研智能SoC芯片“长江”,集成高性能全大核CPU及全功能GPU,异构AI算力达50 TOPS,内置AI智能体、2D数字人和预装Qwen3-8B大模型,支持0.5秒生成数字人形象 [9] - 该设备支持Windows、Linux、安卓容器及所有国产操作系统,旨在将MUSA生态从云端下沉至开发者桌面端,实现开发闭环 [9] 行业背景与公司定位 - 行业正处于从追求参数规模向追求推理效能和生态落地的转型期 [10] - 公司通过展示“花港”架构及“芯-边-端-云”全栈体系,试图摆脱单一硬件供应商身份,转向平台级算力基础设施商 [10] - 中国工程院院士郑纬民指出,发展“主权AI”核心在于算力自主、算法自强与生态自立,强调必须构建易用的国产芯片开发环境以留住开发者社群 [9] 资本市场表现 - 公司股价近期波动明显,12月19日收报664.10元/股,跌幅5.9%,较12月11日高点累计下跌29.4% [10] - 相较于发行价,当前股价涨幅仍超过481%,公司总市值维持在3121.46亿元的高位 [10]
国产GPU第一股,周末大动作!
金融时报· 2025-12-21 10:19
公司技术产品进展 - 摩尔线程举办首届MUSA开发者大会,系统呈现其全功能GPU技术路线,并集中发布一系列技术与产品进展 [1] - 公司发布新一代GPU架构“花港”,相较前代架构,密度提升50%,效能提升10倍,支持十万卡以上规模智算集群 [1] - 公司未来将基于“花港”架构推出高性能AI训推一体“华山”芯片与专攻高性能图形渲染的“庐山”芯片 [1] - 公司宣布推出搭载智能SoC芯片“长江”的AI算力本,作为连接开发者与MUSA生态的核心入口 [1] 行业生态与竞争格局 - 生态建设是GPU行业的核心壁垒之一,例如英伟达的CUDA生态是其构建市场领先地位并实现向计算平台转型的核心护城河 [1] - 中国GPU产业仍处于构建核心技术栈与完整生态的起步阶段,英伟达的CUDA生态在行业内处于垄断地位,国产厂商拓展业务面临高研发难度及计算生态壁垒构建困难等挑战 [2] - 开发者是生态建设的关键,国产芯片平台必须构建起友好、易用的开发环境以有效服务开发者社群 [2] 行业发展机遇与现状 - 发展“主权AI”是提升未来国家竞争力的关键,其核心在于实现“算力自主、算法自强、生态自立”的完整体系 [2] - 国产计算显卡与国外主流产品的性能差距正在持续缩小,构建国产万卡乃至十万卡级别的超大规模智算系统是必须完成的产业基础设施任务 [2] - 中国GPU产业当前正处于AI算力需求井喷与国产化替代并行的战略机遇期 [2] - 国产GPU在AI大模型与智能体、具身智能、科学计算、空间智能、工业智造、数字孪生、数字文娱、智慧医疗等领域已有大量最新落地应用 [2] 公司市场表现 - 摩尔线程股价近日持续调整,12月19日跌幅达5.9%,收报664.10元/股 [2] - 相较于12月11日高点941.08元/股,累计跌幅达29.4% [2] - 相较于发行价仍涨超480%,总市值超3000亿元 [2]
全新架构、万卡集群、智算平台,摩尔线程(688795.SH)开发者大会还有哪些亮点?
智通财经网· 2025-12-21 07:23
核心观点 - 摩尔线程在首届开发者大会上发布了新一代全功能GPU架构“花港”及一系列软硬件产品,展示了其在AI训推、图形渲染、智算集群及个人终端等领域的全栈布局,战略意图从硬件供应商转向平台级算力基础设施商 [1][8][9] 技术架构与芯片发布 - 发布新一代全功能GPU架构“花港”,算力密度较上一代提升50%,能效提升10倍,支持从FP4到FP64全精度,集成AI生成式渲染架构(AGR)和第二代光线追踪硬件加速引擎,计划明年量产 [1] - 基于“花港”架构公布两款核心芯片:“华山”主打AI训推一体和超智融合,内置新一代异步编程模型和全精度MMA,配备MTFP8/6/4混合低精度计算技术 [2] - 另一款芯片“庐山”专攻高性能图形渲染,AI计算性能较前代提升64倍,几何处理性能提升16倍,完整支持DirectX 12 Ultimate [2] 智算中心与集群能力 - 发布“夸娥”万卡智算集群,浮点运算能力达10 Exa-Flops,在Dense大模型上的训练算力利用率(MFU)达60%,在MOE大模型上为40%,有效训练时间占比超90% [4] - 展示与硅基流动的合作成果,在DeepSeek R1 671B全量模型上,MTT S5000单卡的Prefill吞吐量突破4000 tokens/s,Decode吞吐量突破1000 tokens/s [5] - 分享面向下一代智算中心的MTT C256超节点架构规划,旨在通过高密硬件设计提升集群能效 [5] 软件生态与开发者工具 - 自研MUSA架构升级至5.0版本,核心计算库muDNN的GEMM/FlashAttention效率超98%,通信效率达97% [6] - 计划逐步向开发者社区开源计算加速库、通信库及系统管理框架的核心组件 [6] - 计划推出兼容跨代GPU指令架构的中间语言MTX,以及面向渲染与AI融合计算的编程语言muLang,以降低开发者适配门槛 [6] 个人智算终端硬件 - 正式进军个人智算终端硬件领域,发布首款AI算力本MTT AIBOOK,售价9999元(32GB+1TB版本),预计2026年1月10日开售 [7] - MTT AIBOOK搭载自研智能SoC芯片“长江”,集成高性能全大核CPU及全功能GPU,异构AI算力达50 TOPS,内置AI智能体和2D数字人“小麦”,支持0.5秒生成数字人形象,并预装Qwen3-8B大模型 [7][8] - 该设备支持Windows、Linux、安卓容器及所有国产操作系统,旨在将MUSA生态从云端下沉到开发者桌面端,实现开发闭环 [8] 行业背景与战略意图 - 行业正处于从追求参数规模向追求推理效能和生态落地的转型期 [9] - 公司展示的“芯-边-端-云”全栈体系,反映出其试图摆脱单一硬件供应商身份,转向平台级算力基础设施商的战略意图 [9] - 中国工程院院士郑纬民指出,发展“主权AI”的核心在于算力自主、算法自强与生态自立,并强调国产芯片平台必须构建易用的开发环境以留住开发者社群 [8] 资本市场表现 - 公司股价近期波动明显,12月19日收报664.10元/股,跌幅5.9%,相较于12月11日高点累计跌幅达29.4% [9] - 相较于发行价,当前股价涨幅仍超过481%,公司总市值维持在3121.46亿元的高位 [9]
摩尔线程,发布新一代GPU架构
21世纪经济报道· 2025-12-20 21:32
核心观点 - 摩尔线程在登陆科创板后举办首届开发者大会,展示了其基于自研MUSA统一架构的全栈技术成果,并发布了下一代GPU架构“花港”及多款芯片产品,旨在通过架构创新弥补工艺限制,提升国产GPU在AI和高性能图形计算领域的竞争力 [1][2] 技术架构与芯片发布 - 发布新一代全功能GPU架构“花港”,通过全新指令集和异步编程模型实现“工艺不够,架构来补”,在相同工艺下算力密度提升50%,效能提升10倍,支持从FP4到FP64的全精度计算 [1][2] - 基于“花港”架构推出“华山”芯片,面向AI训推一体与超大规模智能计算,其浮点算力、访存带宽、高速互联带宽介于英伟达Blackwell和Hopper架构之间,访存容量优于两者 [4][5] - 同步发布“庐山”芯片,侧重高性能图形渲染,其AI计算性能提升64倍,几何处理性能提升16倍,光线追踪性能提升50倍,并增强了纹理填充和显存容量 [5] - 发布面向端侧的“长江”SoC芯片,集成于MTT AIBOOK笔记本电脑,端侧AI算力为50 TOPS,并预告了迷你计算设备MTT AICube [9] 智算集群与工程化能力 - 发布“夸娥”万卡智算集群,浮点运算能力达到10 Exa-Flops [5] - 该集群在万卡规模下,对Dense大模型的训练算力利用率(MFU)为60%,对MoE大模型的算力利用率为40%,有效训练时间占比超过90%,训练线性扩展效率为95% [5] - 在推理性能实测中,与硅基流动合作优化DeepSeek R1 671B全量模型,MTT S5000单卡的Prefill吞吐超过4000 tokens/s,Decode吞吐超过1000 tokens/s [5] 软件生态与开发者支持 - 升级MUSA统一计算架构至5.0版本,其核心计算库muDNN的GEMM和FlashAttention效率超过98%,通信效率达到97%,编译器性能提升3倍 [8] - 计划逐步开源计算加速库、通信库及系统管理框架等核心组件,并披露了兼容跨代GPU的中间语言MTX、量子计算融合框架MUSA-Q及计算光刻库muLitho等前瞻技术 [8] - 宣布建设MUSA生态中心并启动开发者计划,为科研与创新提供算力支持 [10] 图形技术与前沿领域布局 - 图形技术已支持DirectX 12、OpenGL 4.6、Vulkan 1.3等主流API,并与国产CPU及操作系统完成适配,即将完整支持DirectX 12 Ultimate [10] - 推出AI生成式渲染技术MTAGR 1.0,尝试将渲染范式从计算转向生成 [10] - 在具身智能领域发布MT Lambda仿真训练平台,并计划在2026年第一季度开源关键仿真加速组件Mujoco-warp-MUSA [10] - 提及在科学智能(AI4S)、量子科技、AI for 6G等前沿交叉领域的布局 [10] 公司发展历程与市场表现 - 公司成立于2020年10月,核心团队包括原英伟达中国区总经理张建中及CTO张钰勃,技术路线对标英伟达的通用GPU路径 [11] - 过去四年保持每年迭代一个芯片架构的节奏:2022年“苏堤”架构解决信创PC GPU国产化;2023年“春晓”架构带来量产游戏显卡和云端渲染芯片;2024年“曲院”架构开启AI训推一体并实现千卡集群;今年基于“平湖”架构的S5000已建成万卡智算集群 [8] - 公司于12月5日以114.28元/股登陆科创板,截至12月19日收盘,股价累计涨幅达481%,报664.10元/股,市值约为3121.46亿元 [11] 行业背景 - 受国际环境对高端芯片进口限制的影响,国产AI芯片行业受到资本市场大力追捧,市场空间有所增长 [11]
上市15天,摩尔线程剑指英伟达腹地
虎嗅APP· 2025-12-20 21:20
核心观点 - 摩尔线程在首届MUSA开发者大会上发布了一系列重大技术进展,包括新一代GPU架构“花港”、两款新芯片以及多项软件生态创新,旨在向外界传递其坚定构建以MUSA为核心的、类似英伟达CUDA的生态护城河的决心[4] - 公司正从追求芯片“能用”向“好用”演进,通过发布中间语言MTX、拓展具身智能等新场景,全方位搭建软硬件生态,挑战行业巨头英伟达的生态霸权[4][20][26] 新发布的技术架构与芯片 - 发布全新一代全功能GPU架构“花港”,相比前代“平湖”架构,算力密度提升50%,能效大幅优化,并支持从FP4到FP64的全精度端到端计算[2][11] - 基于“花港”架构发布两款芯片:AI训推一体芯片“华山”和高性能图形渲染芯片“庐山”[2][14] - “庐山”芯片在集成AI生成式渲染后,AI计算性能较前代MTT S80提升64倍,几何处理性能提升16倍,光线追踪性能提升50倍[16] - “华山”芯片能够适配多种“类以太协议”和多种Scale-Up switch,最高支持1024片超节点扩展,体现了生态兼容性[14] 软件生态与关键技术创新 - 首次发布中间语言MTX,作为MUSA 5.0软件栈的一部分,旨在兼容不同代际GPU指令架构,降低开发者适配成本,为上层软件生态提供稳定底层支撑[5][7] - 公司计划在明年上半年向开发者开放自研的MTX,此举被视为挑战行业惯例、构建生态护城河的关键一步[8] - 新一代架构支持自研的MTLink高速互联技术,将支持十万卡以上规模的智算集群扩展[11] - 推出“夸娥万卡智算集群”,在万卡规模下具备全精度、全功能通用计算能力,可实现高效稳定的AI训练与推理[4][18] 产品与应用场景拓展 - 发布面向端侧的“长江”SoC,通过CPU+GPU+NPU组合最高可提供50 TOPS的异构AI算力,并基于此推出了MT Robot具身智能解决方案和“MTT AIBOOK”算力本等产品[21][23] - 推出MT Lambda具身智能仿真训练平台,核心聚焦于“全栈融合”,旨在将物理引擎、渲染引擎与AI引擎深度整合,提升研发效率[25] - MT Lambda平台可直接部署到MT Robot上,形成软硬件高效协同,展示了公司在“端—边—云”算力协调上的布局[23][26] - 新一代“花港”架构内置AI生成式渲染结构并完整支持DirectX 12 Ultimate,预示公司消费级显卡产品将得到迭代[13] 行业背景与公司战略 - 国内GPU行业的叙事重点正从“能用”转向“好用”,在美国对华出口限制(如H200解禁)的背景下,国内从业者感到紧迫[20] - 在GPU行业中,面对英伟达的领先地位,“不做生态”曾被视为某种程度的政治正确,但摩尔线程正通过全方位搭建生态来打破这一惯例[9] - 公司正试图通过“全栈软硬件架构+全场景产品”的布局,在每一个与“计算”相关的行业中占据身位,每一步都在拓展生态边界[26]