Workflow
国产GPU生态
icon
搜索文档
唯快不破!S5000参数首次曝光,发布即适配的国产GPU生态正在形成!
广州日报· 2026-02-12 10:12
核心观点 - 摩尔线程公司实现了其旗舰AI GPU MTT S5000与智谱新一代大模型GLM-5的“发布即适配”,这标志着国产全功能GPU及软件生态在成熟度、敏捷性和对前沿模型支持能力上达到新高度,有望成为行业常态 [1][3] 产品性能与优势 - MTT S5000单卡AI算力最高达1000 TFLOPS,配备80GB显存,显存带宽1.6TB/s,卡间互联带宽784GB/s,完整支持从FP8到FP64的全精度计算 [2] - 在数千亿参数模型的全流程训练验证中,MTT S5000与H100集群结果一致性极高,最终模型关键指标误差仅千分之几,整体训练效果实现小幅超越 [2] - 在典型端到端推理及训练任务中,MTT S5000性能可达竞品H20的2.5倍左右,凭借高算力在计算密集型场景中展现出强劲输出和显著性价比优势 [2] - 通过深度释放原生FP8加速能力,在确保模型精度的同时显著降低了显存占用,实现了GLM-5的高性能推理 [1] 软件生态与技术能力 - MUSA软件栈的成熟度是实现快速适配的关键,其TileLang原生算子单元测试覆盖率已超过80%,使绝大多数通用算子可直接复用,显著降低移植成本 [3] - 通过高效算子融合及框架极致优化,MTT S5000在确保代码生成质量的同时显著降低了响应延迟,在处理复杂任务时能保持低首字延迟和快生成速度的流畅体验 [3] - 公司核心优势在于提供“软硬协同的全栈算力底座”,MUSA架构具有广泛的算子覆盖与强大的生态兼容能力,成功打通了模型推理全链路 [1][2] 应用场景与开发者体验 - MTT S5000与GLM-5的组合在函数补全、漏洞检测、Debug等核心编程场景中表现卓越,以显著增强的逻辑规划能力从容应对各类复杂的长程任务挑战 [1][3] - 该软硬双强组合为开发者带来可对标国际顶尖模型的极致编程体验,是执行长程开发任务的理想选择 [1][3] - 从GLM-4.6、GLM-4.7到GLM-5,公司已将“发布即适配”化为常态,确保开发者能第一时间触达最新模型能力 [3] 行业意义与生态建设 - “发布即适配”的情况有望成为未来国产GPU生态构建的常态 [1] - 国产全功能GPU及MUSA软件栈已经具备相当高的成熟度与稳定性,能够对主流软件栈实现无缝兼容与敏捷响应 [3] - 此次快速适配充分展现了国产全功能GPU对最新大模型即时、高效的支持能力,将携手开发者共建蓬勃发展的国产AI生态 [1][3]
港股GPU第一股壁仞科技上市 和玉资本6年陪伴发展
搜狐财经· 2026-01-02 18:08
公司上市与市场表现 - 壁仞科技于2026年1月2日在港交所主板上市,股票代码06082.HK,成为港股首家专注于GPU芯片和智能计算解决方案的企业,也是18C以来募资金额最高的公司 [1] - 公司发行价格为每股19.60港元,暗盘交易涨幅约80%,开盘价35.7港元,最高涨超118%至42.88港元/股,预计总市值超1000亿港元 [3] - 公司基石投资者阵容豪华,包括启明创投、平安人寿等23家顶级投资机构,共认购3.73亿美元,占发行比例约64% [3] 募资用途与财务数据 - 募资用途约85%将用于研发智能计算解决方案,约5%用于商业化,约10%用作营运资金 [3] - 公司收入从2022年的49.9万元迅速增长至2024年的3.37亿元,年复合增长率高达2499% [12] - 2022年至2025年上半年,研发开支分别为10.179亿元、8.856亿元、8.27亿元、5.716亿元 [12] - 截至2025年12月15日,公司已订立总价值约12.407亿元的销售协议及合同,客户包含9家中国财富500强公司,其中5家为世界财富500强 [12] 产品技术与研发实力 - 公司自主研发壁砺™系列GPU,具有高能效、高算力、高通用性特性,服务领域覆盖AI数据中心、电信、金融科技等关键行业 [3] - 公司实施“1+1+N+X”平台战略,已成功开发量产壁砺™106、110及性能更高的壁砺™166芯片产品 [13] - 作为中国最早实现千卡集群商用的GPGPU公司之一,其千卡智算集群连续运行5天以上无故障,训练服务30多天不中断,线性加速比达95% [13] - 公司计划于2026年推出基于第二代架构的下一代旗舰数据中心芯片BR20X系列 [15] - 根据灼识咨询资料,壁仞科技在中国GPGPU公司中提交的自主研发发明专利申请数量排名第一 [15] 管理团队与公司背景 - 创始人张文拥有哈佛大学法学博士和哥伦比亚大学MBA学位,职业生涯起步于华尔街顶级律所和私募基金,曾与中芯国际创始人张汝京共同创业,并出任商汤科技总裁 [10] - 执行董事兼首席技术官洪洲在GPU设计领域拥有近30年经验,曾任职于S3、英伟达及华为美国研究中心 [10] - 联合创始人兼首席运营官张凌岚拥有超23年半导体行业经验,曾任职于AMD、三星 [10] - 研发人员占比超80% [8] 行业背景与投资逻辑 - 人工智能、自动驾驶等产业的爆炸式增长,对高性能、自主可控算力芯片的需求是刚性的,市场规模将以千亿计 [7] - 投资机构早期投资基于对GPU作为人工智能时代核心算力基础设施不可替代性的判断,以及对“国芯国造”前景的信念 [6][7] - 硬科技产业的发展需要产业链协同共振,投资组合内的企业可在技术、供应链、市场上形成协同效应 [16]
摩尔线程的野心,不藏了
量子位· 2025-12-21 22:13
核心观点 - 摩尔线程在上市后迅速召开首届全功能GPU开发者大会,围绕其自主研发的MUSA架构,发布了一系列从云到端、从算力到生态的新产品与技术,标志着国产GPU能力进入新阶段[1][2][4] MUSA全功能GPU架构 - MUSA是公司自主研发的元计算统一系统架构,定义了从芯片设计到软件生态的统一技术标准,支持AI计算、图形渲染、物理仿真、科学计算及视频编解码等全场景高性能计算[6][7][10] - 发布第五代全功能GPU架构“花港”,在同等芯片面积下算力密度提升50%,计算能效提升10倍,并新增对FP4/FP6低精度计算及混合低精度端到端加速技术的支持,专为AI低比特训练与推理优化[8][13][17] - 花港架构原生支持矩阵rowmax计算以提升混合精度SIMT吞吐量,内置在线量化/反量化、随机舍入等硬件加速能力,为下一代Transformer引擎提供底层支撑[13] - 架构支持通过MTLink高速互联构建十万卡集群,为超大规模模型训练铺平道路[17] 软件栈与开发生态 - 同步推出MUSA软件栈5.0,构建从编译器、算子库到AI框架的全栈工具链,并宣布将逐步开源MATE算子库、MUTLASS、MT DeepEP通信库、KUAE云原生工具包等核心组件[16] - 软件生态广泛适配主流AI框架,除PyTorch、PaddlePaddle外新增对JAX、TensorFlow的支持,并新增强化学习训练框架MT VeRL[18] - 推理引擎深度优化自研MTT推理引擎与TensorX,同时适配SGLang、vLLM、Ollama等新兴推理框架[18] - 核心库muDNN实现GEMM/FlashAttention效率超98%,通信效率达97%,编译器性能提升3倍[18] - 推出面向AI+渲染融合的编程语言muLang,兼容TileLang、Triton,原生支持MUSA C,并发布GPU中间表示语言MTX 1.0以提升开发者调优自由度[18] - 公司打造“摩尔学院”作为开发者成长平台,截至2025年12月已汇聚20万名开发者,目标培育百万规模社群,并通过走进全国200所高校进行产教融合[59][61] 新产品发布:芯片 - 基于花港架构发布两款芯片路线:聚焦AI训推一体及高性能计算的GPU“华山”,以及专为图形计算而生的GPU“庐山”[21][22][28] - “华山”GPU全精度支持从FP4到FP64,具备MTFP4/MTFP6混合低精度加速能力,硬件级优化专为大模型训练定制,标志着公司正式具备支撑万亿参数大模型训练的能力[25][27] - “庐山”GPU引入AI生成式渲染架构和硬件光追引擎,支持DirectX 12 Ultimate,相比上一代产品AI计算性能提升64倍,3A游戏渲染性能提升15倍[30][31] - 首次推出面向端侧场景的智能SoC芯片“长江”,提供50 TOPS的异构AI算力,应用于具身智能、车载、AI计算终端等领域[32][34] 新产品发布:硬件与集群 - 基于长江芯片发布两款硬件:为AI学习与开发者打造的个人智算平台“MTT AIBOOK”,以及桌面高性能AI计算设备“AICube”[36][37][43] - MTT AIBOOK运行MT AIOS操作系统,预置完整AI开发环境,内置智能体“小麦”支持2K高清渲染、本地大模型及端侧ASR/TTS,并预装智源悟界Emu3.5多模态模型[37][40][42] - 发布“夸娥(KUAE 2.0)”万卡智算集群,在Dense大模型上的算力利用率达60%,在MOE大模型上达40%,有效训练时间占比超过90%[46][47] - 公司已完整复现DeepSeek V3的FP8训练,自研FP8 GEMM算力利用率高达90%[47] - 前瞻性披露下一代高密硬件基石“MTT C256超节点”,采用计算与交换一体化设计以提升万卡集群的能效比和训练效能[49][50] 性能验证与行业意义 - 公司与硅基流动合作,在MTT S5000 GPU上成功完成对DeepSeek V3 671B满血版大模型的深度适配与性能验证[53] - 在FP8低精度推理技术加持下,MTT S5000单卡实测Prefill吞吐突破4000 tokens/s,Decode吞吐超1000 tokens/s,创下当前国产GPU在大模型推理场景下的新高[53] - 这一成果表明,在成熟软件工程体系协同优化下,国产算力硬件正从“能跑”迈向“跑得快、跑得稳、跑得值”,单位算力有效利用率成为关键落地指标[54][55] - MUSA架构的创新不仅是对下一代AI基础设施的系统性回答,更是对未来AI产业格局的一次主动定义,使其成为多模态智能、具身智能及物理AI时代的关键使能平台[16][19]
景嘉微同日签署两项战略合作协议,聚焦GPU产品JM11生态融合
巨潮资讯· 2025-10-17 20:22
合作公告概述 - 景嘉微于10月17日分别与吉大正元、苍穹数码签署以JM11 GPU产品为核心的战略合作协议 [2] - 合作模式为生态融合、产品融合、行业融合,旨在完善公司国产GPU生态布局 [2] 与吉大正元合作:数字安全领域 - 合作方吉大正元成立于1999年,注册资本1.94亿元,是一家以上市企业,以密码技术为核心,服务于财政、公安、能源、政府、金融等关键领域 [3] - 合作核心是围绕JM11 GPU的图形和算力特性,在产品整合、市场合作、联合攻关三大方向展开 [4] - 产品整合方面,重点推进JM11与吉大正元高清全栈国产GPU云桌面超融合一体机的整合 [4] - 市场合作方面,双方互为优先供应商,吉大正元将向政企、金融客户优先推荐搭载JM11的配置 [4] 与苍穹数码合作:时空信息领域 - 合作方苍穹数码成立于2001年,注册资本1.30亿元,为非上市企业,专注于时空信息3S平台及解决方案 [5] - 合作以JM11芯片为基础,在技术与产品协同、联合解决方案开发、市场与品牌合作、科研与生态共建四大方向展开 [6][7] - 联合解决方案将针对智慧城市、自然资源、应急救援、工业软件、低空经济、时空智能服务等关键行业 [6] 合作战略意义 - 两项合作符合公司战略发展规划,通过整合合作方技术、资源与市场优势,推进JM11产品研发与市场拓展 [8] - 合作旨在开发具有竞争力的联合产品与方案,提升公司在国产GPU领域的核心竞争力 [8]