Workflow
FP8量化策略
icon
搜索文档
瞄准英伟达!国产算力产业走向“闭环”
经济观察报· 2026-01-09 18:28
资本市场热潮与国产算力产业进步 - 国产算力产业在资本市场运作提速,天数智芯在港交所上市,公开发售获超400倍认购 [2] - 国产GPU头部企业摩尔线程和沐曦股份登陆科创板,上市首日股价分别一度上涨468.78%和692.95%,市值分别突破3055亿元和3300亿元 [2] - 国产存储芯片厂商长鑫科技递交科创板招股书,披露2025年前三季度营收达320.84亿元,2022至2024年主营业务收入复合增长率超70% [2] - 长江存储完成股份制改革,估值达1600亿元,刷新半导体独角兽纪录 [3] - 从芯片设计到存储颗粒,从科创板到港交所的资本热潮间接宣告了国产算力产业的快速进步 [1][4] 硬件竞争焦点转移与“万卡集群”挑战 - 国产算力竞争焦点从比拼硬件参数,转向“万卡集群”的稳定性、软件生态易用性及商业落地性价比 [6] - “万卡集群”意味着指数级增长的故障概率,中科曙光发布的scaleX万卡超集群部署了10240块AI加速卡 [6] - 专家指出,当系统规模达到十万张卡时,平均一小时要出一次错,只要一张卡出错,整个系统就得停下来 [6] - 硬件厂商在“连接”上寻求突破,中科曙光集群采用国产首款400G原生RDMA网络,以解决大规模协同计算对高信号质量、低延迟、大带宽网络的需求 [7] - 英伟达通过GPU、NVLink和InfiniBand网络构成“三驾马车”产品体系,节点间高速互连网络是决定AI集群效率的关键瓶颈 [8] - 未来需采用硅光技术以突破铜缆在高速率下传输距离急剧缩短的物理极限 [8] 存储与计算协同及产业分工 - 在解决“连得上”问题后,需解决“存得下”问题,长鑫科技和长江存储分别卡位DRAM和NAND Flash两大核心存储领域 [9] - 长鑫科技产品线覆盖DDR4到DDR5、LPDDR5X,其首款国产DDR5产品速率达8000Mbps,DDR5承担AI集群数据预处理,其衍生的HBM是决定GPU性能上限的核心要素 [9][10] - 长江存储凭借Xtacking架构在3D NAND领域实现技术突围 [10] - 产业逻辑转向分层解耦、各司其职,海光信息开放其HSL高速互连总线协议,实现了海光CPU与各家GPU的异构互联,技术解耦折射出商业逻辑的妥协与成熟 [11] 软件生态构建与迁移挑战 - 软件生态迁移是比硬件建设更复杂的系统工程,开发者从英伟达CUDA生态切换至国产平台面临巨大代码重构与学习成本 [13] - 摩尔线程发布“MTT AIBOOK”AI算力本预置全栈开发工具,并推出代码生成大模型MUSACode,声称可实现从CUDA代码到MUSA代码的自动化迁移,可编译率达93% [13] - 在企业级市场,云服务商承担“屏蔽差异”职责,优刻得向下适配3到5家主流的国产芯片,通过虚拟化和统一调度,让上层应用感知不到底层硬件差异 [15] - 行业存在生态割裂、互不兼容的问题,构建开放的生态架构已成为行业生存的必选项 [15] - 紫光计算机看到“本地化”价值,推出带有前置可插拔硬盘仓的AI工作站,以应对云端AI的网络延时、隐私风险及海量数据交换效率问题 [16] 供应链波动与产业新变量 - 2025年下半年以来,全球存储颗粒(DRAM/NAND)供应压力巨大,国产化尚无法完全解决全球性供需失衡 [17] - 为应对缺货,云厂商改变采购策略,从按季度规划拉长到按半年规划,并前置采购计划 [17] - 2026年被认为是Agent(智能体)元年,其对算力的消耗是指数级增长,从供需关系看,算力依然短缺,行业面临的是供需错配而非总量过剩 [20] - DeepSeek等国产大模型的爆发反向定义硬件竞争标准,如其采用FP8量化策略,要求芯片厂商优化底层计算库以支持特定计算格式 [21] 应用落地、客户选择与产业闭环形成 - 检验国产算力成色的最终标准是客户选择,中国科学院高能物理研究所已采用国产算力设施进行AI训练和科学计算,评价其性能“完全够用” [19] - 合作模式发生变化,科学家深入参与芯片调优过程,通过联合调试加速软硬件适配 [19] - 国内互联网大厂态度变化,希望拥有更多话语权,接受更开放的架构,海光信息推出定制化产品以迎合需求,建立深层客户绑定 [19][20] - 面对美国可能放宽英伟达H200芯片出口限制的潜在变量,行业认为国内政企客户对供应链安全有刚性考量,且国产算力产业链已形成闭环 [21] - 从长鑫科技、长江存储的存储底座,到中科曙光、海光信息的计算与网络集群,再到摩尔线程、天数智芯适配的终端应用,国产芯片产业已形成一个完整、庞大的产业链条,初步形成生态闭环 [21][22]