行业与公司 * 行业:人工智能大模型与AI算力产业,重点关注国产大模型(如智谱GLM、DeepSeek、字节跳动模型)与国产AI算力卡(如寒武纪MLU、华为升腾)的发展[1][3][8] * 涉及公司: * 大模型公司:智谱AI、DeepSeek、字节跳动、Anthropic、OpenAI、谷歌、Meta[1][2][3][4][5][12] * 算力与芯片公司:寒武纪、海光信息、华为(升腾)、盛科通信[3][8][11][12] 核心观点与论据 1. 大模型技术路径与商业化现状 * 代码能力是核心变现路径:经过两三年发展,写代码能力已成为大模型最主要的商业模式来源[2] * 多模态商业模式尚不成熟:例如,字节跳动的多模态模型月收入仅约10亿人民币,与头部公司数百亿美元的年收入差距显著[1][2] * 全球竞争格局集中且迭代快:北美市场基本集中于Anthropic、OpenAI和谷歌三家公司,技术迭代速度极快,Meta的Llama模型已一年多未迭代,谷歌也有掉队迹象,大厂背景并非成功的绝对保障[4][14] 2. 国产大模型追赶态势超预期 * 能力差距迅速缩小:国产大模型与北美顶尖模型的差距已缩短至3-6个月[1][4][14] * 预计2026年Q4追平北美:基于3-6个月的差距推算,预计中国在2026年第四季度左右就能推出与Claude 5和Mixtral 5同等水平的模型,马斯克预测的2027年Q1可能偏保守[1][4][14] * 代码能力接近顶尖水平:智谱GLM-5.2在代码能力上已极其接近GPT-4.8的水平,差距微小[1][5][6][7] * 多模态能力已达全球顶尖:自2026年春节左右,以字节跳动模型为代表,国产模型在多模态能力上已与北美水平并驾齐驱[1][5] * 用户体验差距在于“Harness”:国产模型在能力上差距不大,但用户体验感觉北美模型更优,主要原因是“Harness”(一套能让用户更好发挥大模型能力的软件架构体系和工程实践)存在差距,DeepSeek已融资500亿人民币组建团队弥补此短板[5] 3. 国产大模型具备显著性价比优势 * 价格优势巨大:智谱GLM-5.2的每百万token输出价格约为4.4美元,仅为OpenAI 4.8(25美元)的约1/6,更是Claude 5和Mixtral 5(50美元)的约1/10[1][4] * 工程师采用组合策略降低成本:工程师在实际工作中会利用Anthropic或OpenAI的模型进行架构构建,然后使用性价比更高的智谱模型完成具体代码编写[6] * 美方限制创造市场空白:美国限制Claude 5和Mixtral 5向海外客户提供服务,为国产大模型厂商留出了巨大的市场空白[1][4] 4. 国产AI算力卡迎来性能拐点 * 2026年能力实现巨大飞跃:相较于2025年仅支持FP16格式的产品,2026年的新一代国产卡(如寒武纪MLU690、华为升腾950)已支持FP8、FP4等主流新型数据格式,并能很好支持超算集群组建[8] * 深度推理效果显著提升:2026年国产卡在大模型深度推理方面的效果已非常出色,其性能表现与token消耗量开始成正比,而在2025年效果还比较差[8] * 预计带动收入高增长:预计相关国产卡公司在2027年的收入将实现同比翻倍以上的增长[1][15] 5. 国产大模型与算力卡形成协同“飞轮效应” * 生态适配实现“零日适配”:以智谱GLM-5.2为例,该模型在发布当天即完成了对国产卡的适配,这得益于DeepSeek V2在开源算子方面的基础工作,目前主流国产大模型均能在发布后一两天内迅速完成适配[3][9][10] * 相互促进:国产大模型的进步带动了token消耗量增长,促进了国产算力卡的需求与发展;国产算力卡的优化与适配又为大模型的推理和训练提供了更好支持[8] 6. 具体产品进展与投资逻辑 * 算力卡产品测试与量产: * 寒武纪MLU690万卡集群正在某大型互联网公司测试,效果反馈良好[11][12] * 华为升腾950系列(包括950P和950D)处于测试阶段,预计2026年8月左右实现量产出货[11] * 推荐投资标的及逻辑: * 智谱AI:其GLM-5.2模型在代码能力上展现很强竞争力[3][12] * 寒武纪:MLU690产品测试进展顺利[3][12] * 海光信息:GPU出货预期不断上调;CPU业务受益于AI Agent发展带来的需求增长,未来CPU与GPU的配比可能从目前的1:4向1:2甚至1:1演进[3][12] * 盛科通信:国内少数能提供25.6T乃至51.2T以上交换机芯片的公司,产品已在一家大型互联网公司全面落地;交换机芯片是AI算力集群的关键组成部分,类比美股博通,该环节重要性高、估值潜力大[3][12][13] 其他重要内容 * 长上下文处理能力突破:智谱GLM-5.2实现了真实的一百万token(一兆)长上下文处理能力,这对需要多轮对话和修改的复杂代码开发任务意义重大,能有效避免因上下文过短导致的连锁错误[7] * AI Agent发展带动CPU需求:AI Agent的发展不仅拉动算力需求,也带来了CPU需求的增长,可能改变CPU与GPU的配比[3][12] * 产业基本面改善明确:国产AI算力卡产业在2026年相较于2025年已出现巨大改善,能力和产能问题均在解决,长期发展空间已被打开,尽管股价可能存在短期波动,但整体向上趋势明确[15]
国产大模型与国产算力共振