国产GPU与大模型适配现状 - 春节前后国产大模型密集发布,包括字节跳动Seedance2.0、智谱GLM-5、MiniMax-M2.5等,国产GPU企业摩尔线程、沐曦股份和天数智芯在模型发布当天即完成适配[1] - 国产GPU企业技术团队在春节期间处于“随时待命”状态,以第一时间对重磅模型(如DeepSeek)进行适配,避免在AI浪潮中掉队[1] - 适配工作旨在让大模型在国产芯片上达到预期性能(如从开箱性能50%调至80%-90%),基于通用GPU架构的适配时间远短于专用NPU架构[2] 国产GPU企业具体适配行动与产品 - 摩尔线程在MTTS5000(2024年推出的AI训练和推理一体产品)上完成对智谱新模型的适配[2] - 沐曦股份基于曦云 C系列芯片完成对智谱新一代大模型的适配[2] - 天数智芯依托天垓系列芯片完成GLM-5新一代大模型的适配[2] - 为抢夺适配时间,国产芯片企业有时采取“人肉递送”硬盘拷贝模型的方式,而非等待网络下载,参与人员需签署保密协议[3][4] 近期国产大模型进展与影响 - 字节跳动Seedance 2.0视频生成模型能力突出,可能推动国内AI漫剧、AI短剧规模化落地[3] - 阿里巴巴Qwen-Image-2.0图像生成模型在部分基准测试中能力仅次于谷歌和OpenAI[3] - MiniMax-M2.5模型在编程、办公等生产力场景达行业头部水平,并以低成本(每秒输出100 token连续工作一小时仅需1美元)为卖点[3] - DeepSeek-R1作为首个打破OpenAI推理垄断的开源模型,引爆了推理市场,提升了市场对大模型应用的信心[6] 国产GPU在AI产业链中的机会与挑战 - 大模型训练环节因成本高、风险大,客户更看重稳定性,目前仍倾向于使用英伟达产品[6] - 推理环节对算力需求相对宽松,且英伟达在华销售芯片功能受限,为沐曦股份、摩尔线程、天数智芯等国产GPU提供了替代机会[7] - 当推理业务达到满意效果时,其所需算力规模可能超过训练需求,长期运行也能验证国产芯片稳定性,打消客户顾虑[7] - 国产芯片在操作手册完善度、部署稳定性等方面与英伟达存在差距,需要在实际应用中“踩坑”和完善[7] 国产GPU企业的技术进步与突破 - 沐曦股份在2025年后软件栈性能泛化性得到很大提高,在搜推广、自动驾驶、AI4S及图生视频等特定场景可与国外厂商竞争[8] - 摩尔线程在2024年实现了万卡规模以上集群、数千亿参数模型的端到端训练落地,被认为是其年度最大突破[8] - 国产芯片企业正尝试攻破英伟达在大模型训练环节的壁垒,并认为国内头部模型与硅谷差距迅速缩小,甚至在某些项目上实现超越[8] - 国产芯片迭代速度加快,例如沐曦股份基本做到每两年至少推出两颗芯片,以抓住AI算力需求暴涨的机会[10][11] 市场合作、需求与未来展望 - 国产大模型与国产算力的配合已“渐入佳境”,Day 0适配成为常规状态[9] - 国产芯片企业与百度、腾讯、智谱、阶跃星辰等大模型公司签署了战略合作协议,合作日益紧密[9] - DeepSeek带动了私有化部署浪潮,促进了国产GPU在一体机上的推广,若其新一代模型能力大幅提升,可能刺激央企国企加大部署,为国产GPU带来更广阔市场(如基层营业厅部署一体机)[9] - 云计算客户(如优刻得)在算力卡选型上有主动权,2025年以来已有国企大客户开始指定在云服务中选用部分国产芯片[11] - 国内GPU企业在制程层面尚有短板,但行业对其通过工程学攻克难题持乐观态度,并正从与英伟达的差异化竞争(实际落地效果和性能)中寻找出路[12]
GPU四小龙,春节不打盹儿
第一财经·2026-02-14 18:23