DeepSeek v4 - 财报，业绩电话会，研报，新闻

DeepSeek v4

搜索文档

山西证券研究早观点-20260306

山西证券· 2026-03-06 10:27

核心观点 - 英伟达FY2026Q4业绩远超预期，数据中心与网络业务增长强劲，AI算力需求持续，为产业链带来增长机遇[7] - 3月行业催化剂密集，包括英伟达GTC2026大会、DeepSeek新品发布及MWC2026，重点关注国产算力、CPO/NPO、卫星互联网等方向[7][8] - 通信行业市场表现强劲，上周申万通信指数上涨4.76%，IDC、连接器、光缆海缆等细分板块领涨[11] - 国际运动服饰品牌2026财年营收展望呈现分化，On、Amer Sports、Asics预计实现双位数增长，而Puma等品牌增长承压[12][13] 市场走势与行业表现 - 2026年3月6日，国内市场主要指数普涨：上证指数收于4108.57点，涨0.64%；深证成指收于14088.84点，涨1.23%；创业板指收于3216.94点，涨1.66%；科创50收于1405.35点，涨1.72%[4] - 上周（2026.02.23-2026.02.27）申万通信指数大幅上涨4.76%，跑赢主要宽基指数[11] - 通信细分板块中，IDC板块周涨幅达36.44%，连接器板块涨11.39%，光缆海缆板块涨9.11%[11] - 通信个股方面，润泽科技、瑞可达、高澜股份、烽火通信、亨通光电涨幅领先，周涨幅分别为35.15%、30.71%、24.31%、23.80%、23.38%[11] 通信行业核心动态与展望 - **英伟达业绩超预期**：FY2026Q4营收达681亿美元，同比增长73%，环比增长20%；净利润430亿美元，同比增长94%，环比增长35%[7] - **数据中心业务强劲**：FY2026Q4数据中心营收623亿美元，同比增长75%，环比增长22%；其中计算营收513亿美元，网络营收110亿美元，网络产品同比增长263%，环比增长34%[7] - **未来增长指引乐观**：英伟达对FY2027Q1营收指引为780亿美元左右，超出市场预期；过去四个季度已累计出货600万颗Blackwell GPU，Blackwell+Rubin平台预计销售额将超过5000亿美元[7] - **AI智能体驱动增长**：AI编程智能体工作流的token增长具有超线性、多线程特性，将是中短期主要驱动力；B端、G端市场空间即将爆发[7] - **3月重要行业催化剂**： - 英伟达GTC2026大会将于3月中旬举行，预计揭晓CPO、LPU、Feynman架构最新路线图，明确技术路径[7] - DeepSeek v4多模态大模型或于近期发布，预计在coding和多模态性能上大幅提升，并原生适配国产芯片（如昇腾）[8] - 世界移动通信大会（MWC2026）将于3月2日至5日举行，主题围绕AI与6G，关注AI终端、光通信、卫星通信等[8] - **技术升级路径明确**： - Rubin平台将通过Vera CPU等六大核心芯片在算力、HBM、光连接等方面全面升级[7] - Rubin平台在Scaleout层面或提供多款CPO交换机，Scaleup层面的Rubin Ultra将尝试Kyber机柜架构，为下一代Feynman GPU铺路[7] - 对于Feynman架构，需关注A16制程、3D堆叠SRAM、内存池架构及光IO技术的进化[7] - **地缘冲突凸显卫星互联网价值**：近期军事冲突凸显高精度卫星遥感与广覆盖卫星通信的作用，卫星板块经历调整后具备再启动可能[8] - **建议关注方向与标的**： - CPO/NPO光引擎：中际旭创、新易盛、天孚通信等[11] - 柜内光无源器件：太辰光、天孚通信、致尚科技等[11] - 国产算力：华丰科技、寒武纪、摩尔线程等[11] - 卫星互联网：航天电子、信科移动、烽火通信等[11] 国际运动服饰品牌2026财年展望 - **On**：2025财年营收同比增长30%，2025Q4营收同比增长23%；预计2026财年营收达34.4亿瑞士法郎，汇率中性下同比增长23%[12] - **Amer Sports**：2025财年营收同比增长27%，2025Q4营收同比增长28%；预计2026财年营收同比增长16%-18%，其中功能服饰与户外服饰均预计增长18%-20%[12] - **Asics**：2025财年营收同比增长20%，2025Q4营收同比增长21%；预计2026财年营收同比增长17.2%[13] - **Adidas**：主品牌汇率中性下，2025财年营收同比增长13%，2025Q4营收同比增长11%；预计2026财年营收同比增长高单位数[13] - **Columbia**：2025财年营收同比增长1%，2025Q4营收同比下降2%；预计2026财年营收同比增长1%-3%，预计26Q1收入同比下降2.5%-4.0%[13] - **Puma**：2025财年营收同比下降8%，2025Q4营收同比下降21%；预计2026财年营收同比下降低至中单位数[13]

通信行业周跟踪：英伟达业绩超预期，3月催化剂密集关注市场波动下的布局良机

山西证券· 2026-03-05 18:24

行业投资评级 - 通信行业评级：领先大市-A（维持）[1] 报告核心观点 - 英伟达业绩超预期，3月催化剂密集，关注市场波动下的布局良机[1] - AI编程智能体工作流驱动token超线性增长，B端、G端市场空间爆发在即[2] - 英伟达GTC2026大会将揭晓多项技术路线图，海外算力板块催化在即[2] - DeepSeek新品发布与MWC2026大会将开启，关注国产算力和卫星互联网机会[3][4] 行业动向与核心事件总结 - **英伟达FY2026Q4业绩超预期**：第四财季实现营收681亿美元，同比增长73%，环比增长20%；净利润430亿美元，同比增长94%，环比增长35%[2] - **数据中心业务强劲**：第四财季数据中心营收623亿美元，同比增长75%，环比增长22%；其中网络产品营收110亿美元，同比增长263%，环比增长34%[2] - **未来增长指引乐观**：英伟达对2027财年第一财季营收指引为780亿美元左右，高于市场预期[2] - **Blackwell GPU出货与未来销售预期**：过去四个季度累计出货600万颗Blackwell GPU，Blackwell+Rubin平台预计销售额将超过5000亿美元[2] - **GTC2026大会前瞻**：预计3月中旬公布CPO、LPU、Feynman架构最新路线图；Rubin平台将在算力、HBM、光连接等方面全面升级[2] - **CPO/NPO技术关注点**：市场对CPO渗透率及光模块厂商参与度存在分歧，GTC2026有望提供更明确信息；Rubin Ultra将首次尝试Kyber机柜架构，CPO/NPO在柜内光的预期行情或于2026年开始体现[2] - **DeepSeek v4即将发布**：预计为支持图片、视频、文本生成的原生多模态大模型，性能将大幅提升，并可能原生适配国产芯片（如昇腾）[3][4] - **MWC2026大会看点**：将于3月2日至5日举行，主题围绕AI与通信，主要看点包括AI终端、6G、光通信、卫星通信[4] - **卫星互联网再受关注**：近期地缘冲突凸显卫星通信作用，板块经历调整后具备再启动可能，看好通信载荷、星间激光、手机直连卫星芯片等赛道[4] 市场行情回顾总结 - **整体市场表现**：本周（2026.02.23-2026.02.27）市场整体上涨，申万通信指数涨4.76%，表现领先于主要股指（深圳成指涨2.80%，上证综指涨1.98%，科创50涨1.20%，沪深300涨1.08%，创业板指涨1.05%）[5] - **细分板块表现**：周涨幅前三的板块为IDC（+36.44%）、连接器（+11.39%）、光缆海缆（+9.11%）[5] - **个股涨跌幅**：涨幅前五为润泽科技（+35.15%）、瑞可达（+30.71%）、高澜股份（+24.31%）、烽火通信（+23.80%）、亨通光电（+23.38%）；跌幅前五为网宿科技（-10.30%）、长芯博创（-5.33%）、太辰光（-5.15%）、英维克（-4.10%）、数据港（-3.29%）[5] 投资建议与关注方向 - **CPO/NPO光引擎**：建议关注中际旭创、新易盛、天孚通信、环旭电子、源杰科技[5] - **柜内光无源器件**：建议关注太辰光、天孚通信、致尚科技、唯科科技、长芯博创、仕佳光子、蘅东光[5] - **国产算力**：建议关注华丰科技、华工科技、寒武纪、摩尔线程、沐曦股份、天数智芯、盛科通信[5] - **卫星互联网**：建议关注航天电子、信科移动、烽火通信、上海瀚讯、长江通信、智明达、电科蓝天、电科芯片[5]

通信行业：英伟达业绩超预期，3月催化剂密集关注市场波动下的布局良机

山西证券· 2026-03-05 15:55

行业投资评级 - 领先大市-A（维持）[1] 核心观点 - 英伟达FY2026Q4业绩超预期，数据中心及网络业务表现亮眼，预示铜连接、1.6T光模块等产业链公司25Q4、26Q1有望实现显著环比增长[4][14] - 3月催化剂密集，包括英伟达GTC2026大会将揭晓CPO、LPU、Feynman等最新技术路线图，以及DeepSeek新品发布和MWC2026大会，关注海外算力、国产算力及卫星互联网等板块的布局机会[1][5][6][7][15][16][17] 周观点和投资建议周观点 - **英伟达业绩强劲**：FY2026Q4营收681亿美元，同比增长73%，环比增长20%，净利润430亿美元，同比增长94%，环比增长35%[4][14] - **数据中心业务超预期**：第四财季数据中心营收623亿美元，同比增长75%，环比增长22%，其中网络产品营收110亿美元，同比增长263%，环比增长34%[4][14] - **未来增长指引乐观**：公司对2027财年第一财季营收指引为780亿美元左右，超出市场预期，过去四个季度已累计出货600万颗Blackwell GPU，Blackwell+Rubin平台预计销售额将超过5000亿美元[4][14] - **AI驱动增长**：AI编程智能体工作流的token增长具有超线性、多线程、不可预测特性，将是中短期token增长的主要驱动，B端、G端市场空间爆发在即[4][14] - **GTC2026技术展望**：大会将展示Rubin平台细节，包括NVL8、VR NVL72等多种SKU，在算力、HBM、光连接等方面全面升级，并有望明确CPO渗透率及光模块厂商参与度等市场分歧[5][15] - **下一代架构演进**：2027年推出的Rubin Ultra可能采用正交背板和CPO/NPO两种互联方式，其Kyber机柜架构是下一代Feynman GPU的主要形态，CPO/NPO在柜内光的预期行情或于2026年开始体现[5][15] - **国产算力与卫星互联网机遇**：DeepSeek v4多模态大模型即将发布，可能原生适配国产芯片，意味着国产芯片在推理市场已具备生产级能力[6][7][16][17] - **MWC2026看点**：大会聚焦AI终端、6G、光通信、卫星通信，近期地缘冲突凸显卫星遥感与通信作用，卫星板块经历调整后具备再启动可能，看好通信载荷、星间激光、星载算力服务器等赛道[7][17] 建议关注 - **CPO/NPO光引擎**：中际旭创、新易盛、天孚通信、环旭电子、源杰科技[8][18] - **柜内光无源器件**：太辰光、天孚通信、致尚科技、唯科科技、长芯博创、仕佳光子、蘅东光[8][18] - **国产算力**：华丰科技、华工科技、寒武纪、摩尔线程、沐曦股份、天数智芯、盛科通信[8][18] - **卫星互联网**：航天电子、信科移动、烽火通信、上海瀚讯、长江通信、智明达、电科蓝天、电科芯片[8][18] 行情回顾市场整体行情 - 本周（2026.02.23-2026.02.27）市场整体上涨，申万通信指数涨4.76%，表现领先于深圳成指（+2.80%）、上证综指（+1.98%）、科创50指数（+1.20%）、沪深300（+1.08%）和创业板指（+1.05%）[8][18] 细分板块行情 - 周涨幅最高的前三板块为IDC（+36.44%）、连接器（+11.39%）、光缆海缆（+9.11%）[8][18] 个股公司行情 - **涨幅领先个股**：润泽科技（+35.15%）、瑞可达（+30.71%）、高澜股份（+24.31%）、烽火通信（+23.80%）、亨通光电（+23.38%）[8][31] - **跌幅居前个股**：网宿科技（-10.30%）、长芯博创（-5.33%）、太辰光（-5.15%）、英维克（-4.10%）、数据港（-3.29%）[8][31]

刚刚，梁文锋署名开源「记忆」模块，DeepSeek V4更细节了

36氪· 2026-01-13 08:42

公司技术发布 - DeepSeek与北京大学合作发布新论文《Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models》，提出条件记忆（conditional memory）新概念，以解决现有Transformer架构缺乏原生知识查找机制的问题 [1][3] - 公司提出并实现了一个名为“Engram”的新模块，旨在与混合专家（MoE）的条件计算形成互补，相关代码已在GitHub开源，项目获得167个星标和5个分支 [3][4][5] - 结合此前发布的《mHC: Manifold-Constrained Hyper-Connections》研究，DeepSeek v4模型的架构设计已愈发清晰 [8] 技术创新与架构 - Engram模块的设计目标是将静态模式存储与动态计算过程从Transformer主干网络中分离并增强，对序列中每个位置依次执行检索与融合两个功能阶段 [10] - 在检索阶段，通过提取与压缩当前位置的后缀N-gram，并使用确定性哈希机制以O(1)时间复杂度检索静态嵌入向量 [12] - 在融合阶段，通过上下文感知门控机制对检索到的静态嵌入进行动态调整，并用轻量级卷积操作精炼，最后与多分支架构集成 [12][14] - 该架构通过分词器压缩（将128k词表规模缩减约23%）和多头哈希等方法，解决了对所有可能N-gram组合进行参数化在计算和存储上不可行的问题 [13] 系统效率与扩展性 - Engram采用的确定性检索机制支持将参数存储与计算资源解耦，不同于MoE的动态路由，其检索索引完全由输入token序列决定，支持专门的优化策略 [15] - 在训练阶段，采用模型并行将大规模嵌入表分片分布在多GPU上，通过All-to-All通信收集激活的嵌入行，使总可用记忆容量能随加速器数量线性扩展 [17] - 在推理阶段，支持“预取-重叠”策略，可提前从主机内存异步预取嵌入向量，并利用前序Transformer层的计算缓冲来掩盖通信延迟 [17] - 利用N-gram的Zipfian分布特性，可构建多级缓存层次结构，将高频嵌入缓存于GPU HBM或主机DRAM，低频模式存于NVMe SSD，从而扩展到极大规模记忆容量且对延迟影响最小 [18] 性能表现与实验结果 - 在总参数量267亿、激活参数量38亿的同等条件下，Engram-27B模型在多项基准测试中性能显著优于纯MoE-27B基线模型 [8][28] - 具体性能提升包括：知识检索任务（MMLU提升+3.4、CMMLU提升+4.0）、通用推理能力（BBH提升+5.0、ARC-Challenge提升+3.7）以及代码与数学推理任务（HumanEval提升+3.0、MATH提升+2.4） [9][28] - Engram能够将静态知识重建负担从模型浅层剥离，有效加深网络用于复杂推理的有效深度，并通过释放注意力机制容量来显著提升长上下文检索能力（如Multi-Query NIAH准确率从84.2提升至97.0） [9][30] - 在包含2620亿token的语料库上预训练后，Engram-27B在大多数基准测试上超越了同等FLOPs的Dense-4B和MoE-27B模型，Engram-40B（总参数量395亿）进一步减少了预训练损失并提高了大多数基准测试的性能 [27][28][29] 扩展规律与稀疏性分配 - 研究发现MoE（条件计算）与Engram（条件记忆）之间的稀疏参数分配存在一条呈U型的最优扩展规律，用以刻画神经计算与静态记忆之间的最优权衡关系 [8][19] - 在总参数量和训练计算量固定的条件下，将大约20%-25%的稀疏参数预算重新分配给Engram能获得最佳性能，纯MoE基准被证明是次优的 [22][23] - 定量分析显示，在100亿参数范围内，验证损失从纯MoE的1.7248改善到最优分配时的1.7109（Δ = 0.0139） [23] - 在固定MoE主干（总参数量约30亿，激活参数量5.68亿）上附加Engram表并扩展槽数，验证损失随内存槽数量增加遵循严格的幂律持续改善，表明Engram提供了可预测的扩展旋钮 [21][23] 长上下文能力分析 - Engram通过将局部依赖建模卸载至静态查找，为处理全局上下文保留了宝贵的注意力容量，从而在长文本任务中带来显著性能增益 [30] - 在严格控制基础模型能力的对比测试中，Engram-27B在等损耗设置和等计算量设置下，均在长上下文检索和推理任务上显著超越MoE-27B基准模型 [31][32][33] - 即使在仅使用约82%计算量的极端设置下，提前停止训练的Engram-27B在LongPPL指标上与完整训练的MoE-27B持平，并在RULER测试中实现超越 [33]

Artificial Intelligence

Artificial Intelligence

Engram模块

DeepSeek v4

刚刚，梁文锋署名开源「记忆」模块，DeepSeek V4更细节了

机器之心· 2026-01-13 08:12

文章核心观点 - DeepSeek与北京大学合作发布新研究，提出“条件记忆”作为大语言模型稀疏化的新维度，并通过新模块“Engram”实现，旨在解决现有Transformer架构缺乏原生知识查找机制的问题 [1][2][3] - 条件记忆与混合专家模型的条件计算形成互补，研究发现了MoE与Engram之间最优分配的U型扩展规律，在等参数量、等FLOPs条件下，集成Engram的模型性能显著优于纯MoE基线 [7][8][9][10] - Engram模块通过确定性的哈希检索机制，能以O(1)时间复杂度完成知识查找，并将存储与计算解耦，在系统层面实现高效扩展，有望成为下一代稀疏大模型的核心建模原语 [8][11][12] 技术方案：Engram模块设计 - **核心架构**：Engram模块在结构上将静态模式存储与动态计算从Transformer主干网络中分离，对序列每个位置依次执行检索与融合两个功能阶段 [12][14] - **检索机制**：采用基于哈希N-gram的稀疏检索，首先对当前位置后缀进行提取与压缩，并通过哈希以确定性方式检索静态嵌入向量，此过程引入词表投影将有效词表规模缩减约23% [14][15] - **融合机制**：检索后引入上下文感知门控机制，对检索到的静态嵌入向量进行动态调整和精炼，以适应当前上下文并减少噪声干扰 [16][17] 系统效率与扩展优势 - **计算存储解耦**：Engram的确定性检索机制支持将参数存储与计算资源解耦，不同于MoE的动态路由，其检索索引完全由输入决定，支持训练时的模型并行和推理时的预取-重叠策略 [18][20] - **分层缓存设计**：利用N-gram的Zipfian分布特性，构建多级缓存层次结构，将高频嵌入存于GPU HBM或主机DRAM，低频模式存于NVMe SSD，从而支持极大规模记忆容量扩展 [21] - **几乎零开销**：确定性的寻址方式支持从主机内存预取，几乎不会带来额外性能开销 [11] U型扩展规律与稀疏性分配 - **最优分配比例**：在总参数量和训练计算量固定下，研究发现了MoE与Engram分配比例与验证损失间的U型关系，将约20%-25%的稀疏参数预算分配给Engram能获得最佳性能 [24][26][27] - **纯MoE次优**：实验表明纯MoE基准是次优的，在10B规模范围内，将稀疏参数预算的约80%分配给MoE，约20%分配给Engram时，验证损失从1.7248改善至1.7109 [26][27] - **无限记忆扩展**：在固定MoE主干上激进扩展Engram记忆槽数量，验证损失持续稳定改善，且遵循严格的幂律，表明Engram提供了可预测的、无需额外计算的扩展能力 [25][27] 实验结果：模型性能对比 - **实验设置**：训练了Dense-4B、MoE-27B、Engram-27B和Engram-40B四个模型，在包含2620亿token的语料库上预训练，激活参数量严格匹配 [33][34][35] - **全面性能提升**：在等参数量、等FLOPs条件下，Engram-27B在所有基准测试中持续优于MoE-27B，提升不仅限于知识任务（如MMLU提升+3.0，CMMLU提升+4.0），在通用推理（如BBH提升+5.0，ARC-Challenge提升+3.7）及代码数学推理（如HumanEval提升+3.0，MATH提升+2.4）上更为显著 [10][37] - **扩展有效性**：扩展至Engram-40B进一步降低了预训练损失，并提高了大多数基准测试性能，表明扩展的记忆容量尚未在当前token预算内完全饱和 [38] 长上下文能力分析 - **架构优越性**：在控制基础模型能力的前提下，Engram在长上下文任务中表现出显著增益，例如在多查询NIAH任务中准确率从84.2提升至97.0 [10][44] - **等损耗设置对比**：当预训练损失对齐时，Engram-27B在复杂检索任务上大幅超越MoE-27B基准（多查询NIAH：97.0 vs 84.2；变量跟踪VT：87.2 vs 77.0） [45] - **注意力容量释放**：通过将局部依赖建模卸载至静态查找，Engram为处理全局上下文保留了宝贵的注意力容量，从而提升了长程检索和推理能力 [40] 表示对齐与收敛速度 - **加速收敛**：基于LogitLens的逐层KL散度分析显示，在模型浅层KL散度持续保持较低水平，表明Engram加速了预测的收敛 [44] - **有效深度增加**：基于CKA计算的相似度热力图显示，Engram浅层在功能上等效于MoE模型的深层，从而有效地增加了模型的有效深度 [44]

条件记忆（conditional memory）

大语言模型稀疏化

Artificial Intelligence

Engram模块

DeepSeek v4

条件记忆（conditional memory）

大语言模型稀疏化

Artificial Intelligence

Engram模块

DeepSeek v4