国产大模型与国产算力共振

行业与公司 * 行业：人工智能大模型与AI算力产业，重点关注国产大模型（如智谱GLM、DeepSeek、字节跳动模型）与国产AI算力卡（如寒武纪MLU、华为升腾）的发展[1][3][8] * 涉及公司： * 大模型公司：智谱AI、DeepSeek、字节跳动、Anthropic、OpenAI、谷歌、Meta[1][2][3][4][5][12] * 算力与芯片公司：寒武纪、海光信息、华为（升腾）、盛科通信[3][8][11][12] 核心观点与论据 1. 大模型技术路径与商业化现状 * 代码能力是核心变现路径：经过两三年发展，写代码能力已成为大模型最主要的商业模式来源[2] * 多模态商业模式尚不成熟：例如，字节跳动的多模态模型月收入仅约10亿人民币，与头部公司数百亿美元的年收入差距显著[1][2] * 全球竞争格局集中且迭代快：北美市场基本集中于Anthropic、OpenAI和谷歌三家公司，技术迭代速度极快，Meta的Llama模型已一年多未迭代，谷歌也有掉队迹象，大厂背景并非成功的绝对保障[4][14] 2. 国产大模型追赶态势超预期 * 能力差距迅速缩小：国产大模型与北美顶尖模型的差距已缩短至3-6个月[1][4][14] * 预计2026年Q4追平北美：基于3-6个月的差距推算，预计中国在2026年第四季度左右就能推出与Claude 5和Mixtral 5同等水平的模型，马斯克预测的2027年Q1可能偏保守[1][4][14] * 代码能力接近顶尖水平：智谱GLM-5.2在代码能力上已极其接近GPT-4.8的水平，差距微小[1][5][6][7] * 多模态能力已达全球顶尖：自2026年春节左右，以字节跳动模型为代表，国产模型在多模态能力上已与北美水平并驾齐驱[1][5] * 用户体验差距在于“Harness”：国产模型在能力上差距不大，但用户体验感觉北美模型更优，主要原因是“Harness”（一套能让用户更好发挥大模型能力的软件架构体系和工程实践）存在差距，DeepSeek已融资500亿人民币组建团队弥补此短板[5] 3. 国产大模型具备显著性价比优势 * 价格优势巨大：智谱GLM-5.2的每百万token输出价格约为4.4美元，仅为OpenAI 4.8（25美元）的约1/6，更是Claude 5和Mixtral 5（50美元）的约1/10[1][4] * 工程师采用组合策略降低成本：工程师在实际工作中会利用Anthropic或OpenAI的模型进行架构构建，然后使用性价比更高的智谱模型完成具体代码编写[6] * 美方限制创造市场空白：美国限制Claude 5和Mixtral 5向海外客户提供服务，为国产大模型厂商留出了巨大的市场空白[1][4] 4. 国产AI算力卡迎来性能拐点 * 2026年能力实现巨大飞跃：相较于2025年仅支持FP16格式的产品，2026年的新一代国产卡（如寒武纪MLU690、华为升腾950）已支持FP8、FP4等主流新型数据格式，并能很好支持超算集群组建[8] * 深度推理效果显著提升：2026年国产卡在大模型深度推理方面的效果已非常出色，其性能表现与token消耗量开始成正比，而在2025年效果还比较差[8] * 预计带动收入高增长：预计相关国产卡公司在2027年的收入将实现同比翻倍以上的增长[1][15] 5. 国产大模型与算力卡形成协同“飞轮效应” * 生态适配实现“零日适配”：以智谱GLM-5.2为例，该模型在发布当天即完成了对国产卡的适配，这得益于DeepSeek V2在开源算子方面的基础工作，目前主流国产大模型均能在发布后一两天内迅速完成适配[3][9][10] * 相互促进：国产大模型的进步带动了token消耗量增长，促进了国产算力卡的需求与发展；国产算力卡的优化与适配又为大模型的推理和训练提供了更好支持[8] 6. 具体产品进展与投资逻辑 * 算力卡产品测试与量产： * 寒武纪MLU690万卡集群正在某大型互联网公司测试，效果反馈良好[11][12] * 华为升腾950系列（包括950P和950D）处于测试阶段，预计2026年8月左右实现量产出货[11] * 推荐投资标的及逻辑： * 智谱AI：其GLM-5.2模型在代码能力上展现很强竞争力[3][12] * 寒武纪：MLU690产品测试进展顺利[3][12] * 海光信息：GPU出货预期不断上调；CPU业务受益于AI Agent发展带来的需求增长，未来CPU与GPU的配比可能从目前的1:4向1:2甚至1:1演进[3][12] * 盛科通信：国内少数能提供25.6T乃至51.2T以上交换机芯片的公司，产品已在一家大型互联网公司全面落地；交换机芯片是AI算力集群的关键组成部分，类比美股博通，该环节重要性高、估值潜力大[3][12][13] 其他重要内容 * 长上下文处理能力突破：智谱GLM-5.2实现了真实的一百万token（一兆）长上下文处理能力，这对需要多轮对话和修改的复杂代码开发任务意义重大，能有效避免因上下文过短导致的连锁错误[7] * AI Agent发展带动CPU需求：AI Agent的发展不仅拉动算力需求，也带来了CPU需求的增长，可能改变CPU与GPU的配比[3][12] * 产业基本面改善明确：国产AI算力卡产业在2026年相较于2025年已出现巨大改善，能力和产能问题均在解决，长期发展空间已被打开，尽管股价可能存在短期波动，但整体向上趋势明确[15]