中国版CUDA
搜索文档
上市AI芯片公司落地数个千卡集群;国内有万卡经验的公司不超过3个;拆机DDR4半公开售卖;智算中心建设遇到「死结」
雷峰网· 2025-12-09 18:55
行业活动与会议 - 第八届GAIR全球人工智能与机器人大会将于2025年12月12-13日在深圳举办,聚焦大模型、算力变革、世界模型等议题 [1][20][22] - 大会将开设智算论坛,汇聚AI芯片、智算中心、云计算、基础设施与资本领域的参与者,探讨算力革命的趋势 [1] - 大会将汇集超过50位院士/顶会主席/行业领袖、300多位AI学术青年及1000多位行业精英 [22] 国产AI芯片发展动态 - 一家科创板上市的AI芯片公司严格把控服务器生产质量,已落地数个千卡级别集群项目 [2] - 该公司新一代旗舰产品单卡算力约0.5P,包含全模块的价格为25万元,上一代8卡一体机售价在60-65万元 [2] - 一家头部AI芯片公司近期订单强劲,获得华北某互联网大厂20万片芯片采购订单,专项用于搜索与推荐业务 [3][4] - 该头部芯片公司CEO向华南某互联网大厂承诺“不限量供应”,以巩固头部客户合作 [4] - 某芯片厂商推行严格的“原厂授权销售”机制,下游客户准入需经原厂直接审核 [14] - 近期华东某城市新建的多个算力项目均采用该厂商芯片,且芯片采购方大多与该厂商有关联 [14] 国产算力生态与替代挑战 - 国内头部互联网企业正加速推进国产算力替代,以构建自主可控的算力供应体系 [5] - 大厂普遍采用“场景适配先行、逐步迭代优化”的路径,优先筛选国产芯片能满足需求的业务场景进行适配 [5] - 国产芯片替代面临算子深度定制、模型量化优化、软硬件适配调试、CUDA生态迁移等多重挑战 [5] - 某大厂已成立针对国产算力业务的新部门,以推动替代进度 [5] - 国内正在探索共建中国版CUDA,例如智源研究院牵头的众智FlagOS和北京大学的TileLang [6] - 华为、清微智能、天数智芯、沐曦、算能等公司已加入FlagOS生态,但各家投入资源差异极大,有的仅数人,有的近百人 [6] 智算中心行业现状与瓶颈 - 智算中心项目成功率大幅下降,以前接触10个项目能成5个,现在可能不到1个 [10] - 行业逻辑生变,政府投入减少,参与方不愿承担风险,开始算细账并要求合同及保证金,导致项目推进陷入死循环 [10] - 国内真正具备万卡级集群实际部署与运维经验的算力企业不超过三家,绝大多数厂商仍停留在千卡集群建设阶段 [11][12] - 大规模训练场景中,卡间互联是制约整体效率提升的关键瓶颈 [11] - 英伟达Rubin架构通过新一代NVLink 6交换机芯片、X1600 IB/Ethernet Switch和CPO技术优化大集群内卡间互联 [12] - 政府投入减少后,金融租赁公司成为智算中心项目出资方,但资金成本(毛利加利息)可能高达15%,相比政府投资时大幅提高 [13] - 资金高成本导致出现“项目缺资金,资金缺项目”的死结,除非能找到利率低至2%的资金 [13] 存储芯片市场波动 - 存储芯片价格飙升对部分国内科技企业出海业务造成显著冲击,涨幅已超出某些行业产业链各方承受能力 [7][8] - 某智能模块供应商因存储成本上涨导致产品提价,海外订单明显收缩,国外客户转向观望 [8] - 存储芯片价格持续高位运行,已有厂商开始采用拆解旧设备的“机料”进行生产或转售,现象从“地下”蔓延至半公开状态 [9] - 当前DDR4产能极度稀缺,市场上全新芯片寥寥无几,拆机DDR4成为替代来源,经测试后根据成色定价,与全新芯片价差最多几百元 [9] 新兴趋势与市场拓展 - 生成式AI从云端走向端侧,带火了NPU创业和人才需求 [15] - 拥有苹果背景的上海烨知心、华为老兵创立的智辰科技等端侧NPU初创公司受到资本追捧 [15] - 智能硬件龙头公司及自研芯片的自动驾驶公司也在积极招募NPU人才 [15] - 国内头部AIDC(人工智能数据中心)厂商正加速海外算力市场布局,计划在东南亚地区建设万卡级大规模B200算力集群 [16][17] - 该出海项目规模庞大,已吸引供应链上下游众多厂商关注并寻求合作 [17]