GPGPU
搜索文档
港股上市后首个大动作:天数智芯发布四代芯片路线图,预期2027年超越英伟达Rubin
新浪财经· 2026-01-26 19:45
公司近期动态与战略发布 - 天数智芯于2024年1月8日在港交所主板挂牌上市,当日开盘涨31.54% [1] - 上市后,公司于1月26日正式发布四代GPU架构路线图,并官宣全栈对标英伟达 [1] - 路线图规划:2025年天数天枢架构超越英伟达Hopper;2026年天数天璇架构对标Blackwell,天数天玑架构超越Blackwell;2027年天数天权架构超越英伟达Rubin;2027年后转向突破性计算芯片架构设计 [1][2] - 公司计划未来3年基于四代架构陆续发布多款产品,持续提升计算性能 [4] 产品与技术细节 - 发布边端算力产品“彤央”系列,包括TY1000、TY1100、TY1100_NX、TY1200四款产品 [4][5] - 彤央全系列标称算力为实测稠密算力,覆盖100T到300T范围 [7] - 在多个场景实测中,彤央TY1000性能优于英伟达AGX Orin [7] - 天数天枢架构采用多项技术创新,据称效率较当前行业平均水平提升60%,在DeepSeek V3场景平均性能比英伟达Hopper架构高约20% [4] - 天数天枢架构AI芯片执行注意力机制计算时,算力有效利用率超90% [4] 市场落地与客户进展 - 公司天垓通用GPU兼容性强,国内15种新大模型发布当天便能跑通,目前已稳定运行400余种模型 [8] - 在互联网AI领域,实现单机性能翻倍、Token成本减半、95%算子复用 [8] - 彤央系列已落地多类场景:为格蓝若机器人提供算力;在瑞幸咖啡数千家门店处理视频流数据;与20个试点城市合作验证车路协同方案 [8] - 公司相关产品已服务超300家客户,完成超1000次部署 [8] 产品迭代历史与规划 - 2021年:推出国内首款通用GPU产品天垓Gen 1并实现量产 [8] - 2022年:发布智铠Gen 1及Gen 1X,构建云边结合、训推一体的算力系统 [8] - 2023年:发布并量产天垓Gen 2 [8] - 2024年:发布天垓Gen 3,提升计算效能与集群运行效率 [8] - 根据规划:天垓Gen 4预计于2026年第二季度推出,第三季度量产;天垓Gen 5预计于2027年第一季度推出,第二季度量产 [9] 行业市场前景 - 受AI大模型浪潮驱动,中国智能计算芯片市场正处于爆发期 [1] - 预计到2029年,中国AI芯片出货量将从2024年的250万片增长至1140万片,复合年均增长率达32.1% [1] - 2024年中国GPGPU市场收入规模已达1546亿元人民币 [2] - 预计到2029年,中国GPGPU市场收入规模有望达到7153亿元人民币,2025年至2029年复合年均增长率为29.5% [2]
「寻芯记」“国产GPU四小龙”即将齐聚二级市场,不同路线下谁的“稀缺性”更有含金量
华夏时报· 2026-01-24 13:17
行业与市场格局 - AI芯片成为资本市场竞争焦点,多家中国GPU公司(“国产GPU四小龙”)近期密集登陆二级市场,燧原科技是其中最后一家启动上市的公司 [2] - 2024年中国AI加速器市场中,英伟达占据约70%的绝对主导份额,寒武纪与燧原科技市场份额均约为1.4%,沐曦股份、摩尔线程、壁仞科技、AMD及天数智芯市场份额均小于1% [3] - 根据高盛全球投资研究部模型预测,在AI服务器的AI芯片中,非GPGPU芯片的出货占比预计将从2024年的36%上升至2027年的45%,而GPGPU芯片的出货占比预计将从2024年的64%下降至2027年的55% [6] 公司财务与估值比较 - 2024年营收方面,“国产GPU四小龙”中,沐曦股份以7.43亿元排名第一,燧原科技以7.22亿元排名第二,摩尔线程和壁仞科技分别以4.38亿元和3.37亿元排名第三和第四 [3] - 截至2024年1月23日收盘,已上市的“国产GPU四小龙”中,摩尔线程市值为2907亿元,沐曦股份市值为2350亿元,壁仞科技市值为857.82亿港元 [4] - 已上市的三家公司首日股价涨幅巨大:摩尔线程(科创板)涨425.46%,沐曦股份(科创板)涨692.95%,壁仞科技(港股)涨75.82% [3][4] - 市场分析认为,随着前三家公司先行上市,市场对同类题材的第一轮集中炒作已阶段性完成,作为后来者的燧原科技在上市初期所能吸引的边际关注与增量资金可能受影响,其股价涨幅与市场热度或难以复制前几家的峰值水平 [4] - 已上市公司的股价在经历初期狂热后普遍回调:摩尔线程股价从最高941.08元/股(发行价114.28元/股)回调至618.53元/股;沐曦股份在上市第二日即出现回调;壁仞科技上市首日股价为迄今最高 [4] 技术路线分析 - 燧原科技选择了与英伟达确立的主流GPGPU路径差异化的非GPGPU技术路线,而“国产GPU四小龙”中的其他三家(沐曦股份、摩尔线程、壁仞科技)均选择GPGPU方向 [2][5] - AI芯片主流架构分为以英伟达为首的GPGPU架构和包含谷歌TPU、华为NPU等的非GPGPU架构 [5] - 分析指出,GPGPU在基座大模型训练、通用性要求高的场景(如公有云)及并行计算场景更具竞争力;非GPGPU则在模型部署、推理场景下相对更有优势,因这些场景对能效比、响应延迟要求更高,且推理业务的英伟达CUDA生态护城河相对较浅 [5] - 专家观点认为,GPGPU与非GPGPU未来将并存,全球GPGPU份额下降是必然趋势,原因包括英伟达从“绝对垄断”变为“没那么垄断”,以及未来推理业务需求将成为大头,其中许多确定性的业务场景适合用非GPGPU进行针对性优化 [6] - 长期来看,两条技术路线并非完全对立,将走向融合与市场分层:硬件上,GPGPU会集成更强的专用核心,专用芯片也会增加可编程性;市场上,预计将形成GPGPU主导创新与通用平台、专用芯片深耕规模化推理的分层格局 [7] - 专家指出,非GPGPU路线面临的最大挑战依然是生态问题,能否围绕核心客户构建有生命力的软件栈与开发生态,从而证明其领域优势足以超越通用平台的便利性,是关键目标 [7]
龙芯中科:9A1000是龙芯首款GPGPU芯片,在9月底交付流片
北京商报· 2025-11-17 22:04
公司产品发布 - 龙芯中科于11月17日披露其首款GPGPU芯片9A1000 [1] - 9A1000芯片融合了图形和人工智能算力 可用作AIPC [1] - 该芯片图形性能高于CPU中集成的集显性能 定位为入门级独显 [1] - 公司争取开发9A1000的Windows驱动 使其可与Windows电脑配套 [1] - 9A1000芯片已于9月底交付流片 [1]
清华大学 集成电路学院在 MICRO 2025 成功举办“Ventus:基于 RISC-V 的高性能开源 GPGPU”学术教程
半导体行业观察· 2025-10-26 11:16
项目总览 - 清华大学团队在MICRO 2025会议上成功组织了关于开源GPGPU"乘影"(Ventus)的学术教程[1][15] - 项目基于RISC-V及其向量扩展构建高性能开源通用图形处理器(GPGPU)[1][15] - 项目布局完整,涵盖指令集、硬件架构、编译器、仿真器及验证工具等全栈技术[3][15] 核心架构设计 - 从指令、数据、线程三个并行维度阐明GPGPU作为硬件多线程SIMD处理器的本质[5][16] - 在RISC-V Vector扩展基础上构建功能完备的SIMT架构[5][16] - 微架构实现包括CTA调度器、Core pipeline、warp scheduler等核心组件[5][16] 缓存与内存管理 - 缓存子系统在RISC-V RVWMO内存模型下采用释放一致性引导的缓存一致性机制[6][16] - 通过快通路与稳健通路的分工兼顾低延迟与全局正确性[6][16] - MMU设计将开销控制在15%–25%之间,L1 DTLB命中率超过95%,L2 TLB命中率超过85%[6][16] AI加速单元 - 新一代多精度可复用张量核心支持从FP16到INT4及MX FP8/FP6/FP4等多种新兴数据精度[7][16] - 采用硬件资源复用设计,通过异质乘法器的动态复用节省硬件面积[7] - 集成Tensor Core后,特定负载的指令数与执行周期数分别实现69.1%与68.4%的优化[7][16] 验证框架 - GVM框架是面向Ventus GPGPU的指令级软硬件协同差分验证框架[8][17] - 通过将RTL与定制化指令集模拟器进行差分比较,有效发现多处细微BUG[8][9][17] - 在SIMT语义下引入软件ROB解决GPGPU指令乱序完成带来的验证挑战[8][17] 软件工具链 - 支持OpenCL 2.0 profile,已通过超过85%的OpenCL一致性测试[10][17] - 基于Triton的AI算子库为ML工程师提供友好方式开发高效算子[10][17] - 工具链包含Compiler、Runtime、Driver、Simulator等核心模块,实现从硬件验证到上层程序运行的全流程支持[11][17] 实践演示与验证 - 提供交互式Jupyter网页指导,详细介绍项目开源仓库的组件构成和部署方法[12][17] - 基于VCU128 FPGA构建验证平台,集成Ventus GPGPU核心(1SM 8warp 16thread@50MHz)[13][17] - 成功运行向量加法、高斯消元和MNIST推理等关键测试,完成从仿真到实际硬件加速的全流程验证[13][17]
英伟达:从显卡巨头到AI霸主
钛媒体APP· 2025-07-14 13:29
战略转型与市场地位 - 公司从游戏图形芯片制造商转型为全球人工智能计算基础设施核心供应商,市值一度突破3万亿美元 [1] - 数据中心业务成为主要增长引擎,2025财年第四季度营收393亿美元(同比+78%),其中数据中心业务收入356亿美元(同比+93%) [2] - 2025财年全年营收1305亿美元,同比翻番,AI相关业务成为营收增长主引擎 [2] - 高端GPU产品(H100/H200/Blackwell系列)成为大型AI模型训练的"基础设施"基石,全球主要云服务提供商均大量采购 [3] - 向沙特PIF旗下Humain公司出售超过1.8万个最新AI芯片,用于建设容量最高500兆瓦的数据中心 [3] 技术优势与生态系统 - CUDA平台(2006年推出)构建了围绕英伟达硬件的软件生态系统,为AI计算奠定基础 [6] - 2012年深度学习突破性成果依赖于英伟达GPU和CUDA生态系统 [7] - 持续改进GPU架构(如Tensor Cores)并优化CUDA平台配套软件库(cuDNN/TensorRT) [8] - 通过收购Mellanox进入高性能网络领域,提供高速互连解决方案(InfiniBand) [8] - 开发DGX系列AI超级计算机,提供集成硬件和软件解决方案 [8] 行业领导地位 - 硬件性能和架构领先,与台积电等先进半导体制造商紧密合作保持代际优势 [10][11] - CUDA软件生态系统形成行业标准,全球数百万AI研究人员依赖该平台 [11] - 提供从芯片、板卡、系统、网络到软件的全栈服务能力 [12] - 品牌影响力和开发者社区形成正向反馈循环,巩固市场地位 [12] - 在复杂AI模型训练领域保持绝对优势,竞争对手需在硬件性能和软件生态上同时追赶 [13]