AI集群
搜索文档
瞄准英伟达,国产算力产业走向“闭环”
36氪· 2026-01-09 20:39
文章核心观点 国产算力产业在资本市场表现活跃,多家核心公司成功上市或推进IPO,标志着产业进入快速发展与资本化新阶段[1] 同时,行业竞争焦点已从硬件参数比拼转向大规模集群的稳定性、软件生态的易用性及商业落地的性价比[3] 通过硬件互连技术的突破、存储芯片的自主化、计算架构的开放解耦以及软件生态的积极构建,国产算力产业已初步形成从底层硬件到上层应用的生态闭环,具备了应对外部挑战和把握市场机会的能力[17] 资本市场动态与公司进展 - **天数智芯**于2026年1月8日在港股上市,公开发售获超400倍认购,显示资本市场热情高涨[1] - **摩尔线程**于2025年12月5日登陆科创板,上市首日股价一度上涨468.78%,总市值突破3055亿元[1] - **沐曦股份**于2025年12月17日登陆科创板,上市首日涨幅达692.95%,市值站上3300亿元[1] - **长鑫科技**于2025年12月30日递交科创板招股书,披露2025年前三季度营收达320.84亿元,2022至2024年主营业务收入复合增长率超70%[1][6] - **长存集团**于2025年9月25日完成股份制改革,估值达1600亿元,刷新半导体独角兽纪录[1] 硬件竞争焦点:万卡集群与互连技术 - 行业竞争新标尺转向“万卡集群”的稳定性、软件生态易用性及商业落地性价比[3] - **中科曙光**发布scaleX万卡超集群,由16个scaleX640超节点互连,实际部署10240块AI加速卡[3] - 万卡集群面临指数级增长的故障概率挑战,系统可靠性面临严峻考验[3] - 集群核心突破在于采用国产首款400G原生RDMA网络,以解决高速数据传输瓶颈,其规格指标和实测稳定性已可对标英伟达当前量产产品[4][5] - 未来技术挑战在于物理极限,铜缆传输距离随速率提升急剧缩短,行业需向硅光技术发展以突破极限[5] 存储芯片自主化进展 - **长鑫科技**作为中国最大DRAM设计制造一体化企业,产品线覆盖DDR4到DDR5、LPDDR5X,其首款国产DDR5产品速率达8000Mbps[6] - **长存集团**在NAND Flash领域凭借Xtacking架构实现技术突围[7] - DRAM及衍生的HBM是决定GPU性能上限的核心要素,NAND Flash则是底层存储基础[6][7] - 2025年下半年以来,全球存储颗粒(DRAM/NAND)供应压力巨大,国产化尚无法完全解决全球性供需失衡,导致云厂商采购策略前置[13] 计算架构开放与生态协作 - 行业共识从“全产业链通吃”转向“分层解耦、各司其职”[9] - **海光信息**开放其HSL高速互连总线协议,实现了海光CPU与各家GPU的异构互联,拉通了CPU与GPU[8] - **光合组织**秘书长指出,大规模算力系统已非单一品牌独角戏,协议的打通是关键[7] - 这种技术解耦与开放架构,旨在构建更开放的生态,避免厂商各自为战导致的生态割裂与用户适配成本高企[11] 软件生态构建与迁移策略 - 在英伟达CUDA生态主导下,开发者切换至国产平台面临巨大代码重构与学习成本[10] - **摩尔线程**策略是从个人开发者抓起,发布“MTT AIBOOK”AI算力本实现开箱即用,并推出代码生成大模型MUSACode,声称CUDA到MUSA代码自动化迁移可编译率达93%[10] - 在企业级市场,云服务商承担“屏蔽差异”职责[11] - **优刻得**作为云服务商,向下适配3到5家主流的国产芯片,通过虚拟化和统一调度屏蔽底层硬件割裂,统一管理异构算力[11][12] - **紫光计算机**看到本地化价值,推出带前置可插拔硬盘仓的AI工作站,以应对网络延迟、隐私风险及海量数据交换效率问题[12] 应用落地、客户选择与市场风向 - **中国科学院高能物理研究所**已开始采用国产算力设施进行AI训练和科学计算,评价其性能“完全够用”,并与芯片厂商进行联合调试优化[14] - 国内互联网大厂态度变化,从直接采购国际主流芯片转向希望拥有更多话语权和接受更开放的架构[14] - **海光信息**推出定制化产品,允许大厂将特殊需求写入芯片,以建立深层绑定[14] - 行业认为2026年是Agent(智能体)元年,其对算力的消耗是指数级增长,算力依然短缺,问题在于供需错配而非总量过剩[15] - **DeepSeek**等国产大模型的爆发反向定义硬件标准,如采用FP8量化策略,促使芯片厂商优化底层计算库以支持特定计算格式[15][16] 产业链闭环与应对挑战的能力 - 面对美国可能放宽英伟达H200芯片出口限制的传闻,行业强调国内政企客户对供应链安全有刚性考量[17] - 国产算力产业链已形成闭环:从**长鑫科技**、**长存集团**的存储底座,到**中科曙光**、**海光信息**的计算与网络集群,再到**摩尔线程**、**天数智芯**适配的终端应用[17] - 过去几年,中国算力产业已初步形成紧密咬合的生态闭环,具备了进一步直面挑战的能力[17]
GPU和光模块的需求分析
傅里叶的猫· 2025-08-29 23:33
光模块与AI集群规模关系 - 华为CM384超节点中NPU与光模块比例为1:18 384个NPU需要6912个光模块[4] - 光模块需求随AI集群规模扩大呈非线性增长 1024个GPU集群中光模块与GPU比例约2.5倍 4096个GPU时升至3.5倍 万卡级集群可能达4倍[6] - 网络架构复杂度提升导致非线性增长 集群规模扩大需增加网络层数 如从两层结构增至三层核心交换机[6] 交换机配置影响 - 交换机端口配置显著影响光模块比例 4096个GPU集群使用64×400G端口交换机时比例为3.5倍 使用144×800G端口可降至2.5倍[8] - 超大规模集群中网络复杂性抵消交换机优化效果 超过1万GPU时比例回升至3.5倍[8] - 特定规模区间会出现比例波动 如GPU从1024增至1152时比例短暂升至2.9倍 因叶子节点交换机从32个增至36个导致上层交换机数量翻倍[8] 不同互联方案成本对比 - 英伟达InfiniBand方案成本最高 10万GPU集群物料成本约3.9亿美元 光模块与GPU比例3.6倍[11] - 英伟达以太网方案成本略低 约3.7亿美元 比例2.6倍[11] - 博通以太网方案成本最优 约3.5亿美元 比例2.6倍 较InfiniBand节省约4000万美元[9][11] - 成本差异主要源于网络架构层数差异 InfiniBand需四层结构而博通以太网仅需三层[9] - 博通交换机单价更具优势 128×400G端口交换机成本约0.79亿美元 低于英伟达64×400G交换机的1.36亿美元[9] 技术发展趋势 - 全光互联存在功耗与成本挑战 华为CM384可能在未来部署中引入铜互联[5] - 网络架构可能从三层扩展至四层或五层 光模块与GPU比例可能从3.5倍增至4.5倍[10] - 博通以太网方案展现成本优势 通过优化网络架构和降低交换机单价 可能推动更多企业采用以太网方案[10]
格林大华期货早盘提示-20250716
格林期货· 2025-07-16 07:45
报告行业投资评级 - 宏观与金融板块全球经济投资评级为偏多 [1] 报告的核心观点 - 日债危机升级,10年期收益率逼近1.6%创2008年新高,市场担忧执政联盟失利或引发财政政策转向,日本或重演英国“特拉斯时刻” [1] - 英国6月零售销售同比增长3.1%,超过5月1%的增长,创今年第二大月度增幅 [1] - Meta为突破算力瓶颈,启动两大巨型AI集群普罗米修斯与亥伯龙,前者规模高达1GW [1] - 知名资管机构GMO投资组合经理重申新兴市场债券投资机会“世代难遇”,特朗普政府贸易经济政策使其更具吸引力 [1] - 花旗认为中国6月出口显现韧性,进口同比实现年内首次正增长,反映内需改善,可能支持经济增长轨道稳定 [1] - 欧盟为应对潜在贸易中断,制定报复方案,将提出覆盖约720亿欧元美国进口商品的新关税清单 [1] - 特朗普称若无法在50天内达成协议结束俄乌冲突,美国将对俄罗斯实施“非常严厉的、大约100%的关税”,对购买俄罗斯石油的国家征收次级关税 [1] - 中国GDP上半年增长5.3%,亚洲出口强劲,美国库存未增长,汇丰倾向于认为终端需求强劲 [1] - 市场预期美联储9月降息,2026年加速降息,美国6月Markit制造业PMI终值52.0,继续扩张 [1] - 中国6月PMI生产指数继续扩张、新订单指数重新扩张,综合整治内卷式竞争,有望提振上市公司业绩 [1] - 欧洲央行已降息8次,德国大规模武装,扩军30% [1]
英伟达引爆CPO新战场
半导体芯闻· 2025-03-24 18:20
英伟达CPO交换机发布 - 公司正式推出面向InfiniBand和以太网的两大CPO交换机产品线,分别命名为Quantum-X Photonics与Spectrum-X Photonics [1] - InfiniBand CPO将于2025年下半年首发,以太网CPO计划在2026年下半年面市 [1] - CPO将作为可选配置,公司仍会继续提供采用可插拔模块的传统交换机系统 [2] CPO技术优势 - 采用CPO技术后,1.6T端口的功耗从可插拔光模块的30W骤降至9W,降幅高达70% [2] - 公司的CPO方案采用新型微环调制器(MRM)以实现能效跃升 [2] - 博通的CPO方案通过去除DSP实现了50%的功耗降低,但基于传统MZM调制器 [2] 技术实现与供应链 - 电子芯片与光子芯片通过3D堆叠封装集成,采用台积电的COUPE技术整合微透镜 [3] - 光学引擎组件通过中介层与交换机ASIC连接 [3] - CPO合作伙伴涵盖Browave、Coherent、康宁、Fabrinet、富士康、Lumentum等产业链巨头 [3] 市场影响与产品定位 - 首款CPO产品是InfiniBand交换机,但该协议在公司AI战略中的地位已被以太网反超 [4] - Quantum-X Photonic平台未出现在产品路线图中,预计首批CPO部署主要用于自有集群 [4] - Spectrum-X Photonics平台采用不同设计架构,可能代表第二代技术演进 [4] 技术演进路线 - 预计到2027年,公司与博通都将推出基于单通道200G的CPO交换机 [4] - NVLink CPO定档2028年,公司将有两代产品周期在Scale-out网络中验证技术可行性 [6] - 公司可能正在研究一系列创新光学技术以支持Scale-up能力 [6] 扩展架构设计 - Blackwell架构的NVL72机架通过NVLink+无源铜缆背板构建72 GPU纵向扩展域 [5] - 2026年下半年推出的Vera Rubin NVL144将采用类似设计,无源铜缆用量可能翻倍 [5] - 144个GPU封装可容纳在一个机柜中,最大距离约为2米 [5]