GPU四小龙，春节不打盹儿 | 海斌访谈

行业动态与竞争格局 - 春节前后是国产大模型发布的密集期，字节跳动、智谱、MiniMax等公司相继推出新模型，国产GPU企业摩尔线程、沐曦股份和天数智芯在模型发布当天即完成适配 [2][4] - 人工智能技术日新月异，在春节前后没有行动的大模型和国产芯片企业，可能已经在AI浪潮里掉队 [1][2] - 国产GPU四小龙（摩尔线程、沐曦股份、天数智芯及壁仞科技）的技术团队在春节期间处于随时待命状态，以应对重磅产品发布并第一时间做好适配 [2][7] 国产大模型进展 - 字节跳动旗下火山引擎发布视频生成大模型Seedance 2.0，其生成的视频几乎可以模糊真实与虚拟的边界，可能为国内AI漫剧、AI短剧等规模化落地奠定技术基础 [5] - 阿里巴巴发布新一代图像生成及编辑模型Qwen-Image-2.0，在部分文生图基准测试中，其能力仅次于谷歌和OpenAI旗下的大模型 [6] - MiniMax发布MiniMax-M2.5，在编程、工具调用和搜索、办公等生产力场景达到行业头部水平，该公司称该模型是第一个不考虑使用成本可以无限使用的模型，在每秒输出100 token情况下，模型连续工作一小时只需花费1美元 [6] - 智谱发布大模型GLM-5 [2] 芯片与模型的适配合作 - 芯片企业为抢夺适配时间，有时会采取“人肉递送”模式，在模型正式发布前派人员拿硬盘直接拷贝，公司内部参与项目人员均需签署保密协议 [6] - 对于GPU通用架构，模型适配时间很短，一个人几个小时即可完成；若在NPU等专用架构上，则可能需要几十个人几天 [4] - 国产模型和国产芯片的“Day 0适配”（即模型发布当天完成适配）基本上已成为常规状态 [14] - 本土芯片企业与模型企业合作更紧密，例如沐曦股份与百度、腾讯、智谱、阶跃星辰等签署了战略合作协议 [14] 国产GPU的发展与突破 - 国产GPU产品（如沐曦股份曦云C系列、摩尔线程MTTS5000、天数智芯天垓系列）已可在AI推理环节对功能受限的英伟达在华芯片形成替代 [11] - 推理业务达到用户满意效果时，其所需算力规模预计会超过训练需求，长时间的线上业务运行也能验证国产芯片的稳定性 [11] - 在一些特定作业场景，如搜推广、自动驾驶、AI4S以及图生视频等领域，国产芯片逐渐可以和国外厂商竞争 [12] - 摩尔线程在2024年实现了在万卡规模以上的集群上，完成数千亿参数规模模型的端到端训练落地，这被认为是其过去一年最大的突破 [12] - 沐曦股份在2025年后软件栈的性能泛化性得到了很大提高，芯片开箱性能表现更稳定 [12] 市场驱动与行业影响 - DeepSeek-R1作为第一个打破OpenAI推理垄断的开源模型，引爆了整个推理市场，大幅提升了市场对大模型推理应用的信心，带动了推理相关产品的出货与销售额增长 [9][10] - DeepSeek的发布带动了一轮私有化部署浪潮，推动了沐曦股份等国产芯片在一体机上的推广，优刻得等云计算企业也从中获益 [14] - 大模型在训练环节更看重稳定性，目前企业更倾向于使用英伟达产品；而推理环节对算力需求相对不苛刻，成为国产GPU的机会 [10][11] - 中国市场拥有比美国更广阔的人工智能落地场景，如完善的工业体系和最大的手机使用群体，结合大模型企业的紧密配合，正加速国产芯片的迭代 [14] 技术路线与未来展望 - 国产芯片企业产品迭代速度加快，以抓住AI算力需求暴涨的机遇：摩尔线程每年雷打不动会有一代新架构及超过一款芯片产品面市；沐曦股份基本做到每两年至少推出两颗芯片；天数智芯2026年计划推出两代架构 [15][16] - 摩尔线程在2025年12月发布了未来架构和产品路线图，2026年将基于下一代“花港架构”推出两颗芯片，并追求数量级上的能力提升 [15] - 天数智芯认为，大量商业客户的落地反馈将为架构研发和产品迭代提供实践支撑 [16] - 行业观点认为，国内芯片企业正从实际落地效果和性能等方面与英伟达开始差异化竞争，虽然产品在制程层面尚待突破，但国内产业链正在弥补短板 [16]