DeepSeek v4
搜索文档
山西证券研究早观点-20260306
山西证券· 2026-03-06 10:27
核心观点 - 英伟达FY2026Q4业绩远超预期,数据中心与网络业务增长强劲,AI算力需求持续,为产业链带来增长机遇[7] - 3月行业催化剂密集,包括英伟达GTC2026大会、DeepSeek新品发布及MWC2026,重点关注国产算力、CPO/NPO、卫星互联网等方向[7][8] - 通信行业市场表现强劲,上周申万通信指数上涨4.76%,IDC、连接器、光缆海缆等细分板块领涨[11] - 国际运动服饰品牌2026财年营收展望呈现分化,On、Amer Sports、Asics预计实现双位数增长,而Puma等品牌增长承压[12][13] 市场走势与行业表现 - 2026年3月6日,国内市场主要指数普涨:上证指数收于4108.57点,涨0.64%;深证成指收于14088.84点,涨1.23%;创业板指收于3216.94点,涨1.66%;科创50收于1405.35点,涨1.72%[4] - 上周(2026.02.23-2026.02.27)申万通信指数大幅上涨4.76%,跑赢主要宽基指数[11] - 通信细分板块中,IDC板块周涨幅达36.44%,连接器板块涨11.39%,光缆海缆板块涨9.11%[11] - 通信个股方面,润泽科技、瑞可达、高澜股份、烽火通信、亨通光电涨幅领先,周涨幅分别为35.15%、30.71%、24.31%、23.80%、23.38%[11] 通信行业核心动态与展望 - **英伟达业绩超预期**:FY2026Q4营收达681亿美元,同比增长73%,环比增长20%;净利润430亿美元,同比增长94%,环比增长35%[7] - **数据中心业务强劲**:FY2026Q4数据中心营收623亿美元,同比增长75%,环比增长22%;其中计算营收513亿美元,网络营收110亿美元,网络产品同比增长263%,环比增长34%[7] - **未来增长指引乐观**:英伟达对FY2027Q1营收指引为780亿美元左右,超出市场预期;过去四个季度已累计出货600万颗Blackwell GPU,Blackwell+Rubin平台预计销售额将超过5000亿美元[7] - **AI智能体驱动增长**:AI编程智能体工作流的token增长具有超线性、多线程特性,将是中短期主要驱动力;B端、G端市场空间即将爆发[7] - **3月重要行业催化剂**: - 英伟达GTC2026大会将于3月中旬举行,预计揭晓CPO、LPU、Feynman架构最新路线图,明确技术路径[7] - DeepSeek v4多模态大模型或于近期发布,预计在coding和多模态性能上大幅提升,并原生适配国产芯片(如昇腾)[8] - 世界移动通信大会(MWC2026)将于3月2日至5日举行,主题围绕AI与6G,关注AI终端、光通信、卫星通信等[8] - **技术升级路径明确**: - Rubin平台将通过Vera CPU等六大核心芯片在算力、HBM、光连接等方面全面升级[7] - Rubin平台在Scaleout层面或提供多款CPO交换机,Scaleup层面的Rubin Ultra将尝试Kyber机柜架构,为下一代Feynman GPU铺路[7] - 对于Feynman架构,需关注A16制程、3D堆叠SRAM、内存池架构及光IO技术的进化[7] - **地缘冲突凸显卫星互联网价值**:近期军事冲突凸显高精度卫星遥感与广覆盖卫星通信的作用,卫星板块经历调整后具备再启动可能[8] - **建议关注方向与标的**: - CPO/NPO光引擎:中际旭创、新易盛、天孚通信等[11] - 柜内光无源器件:太辰光、天孚通信、致尚科技等[11] - 国产算力:华丰科技、寒武纪、摩尔线程等[11] - 卫星互联网:航天电子、信科移动、烽火通信等[11] 国际运动服饰品牌2026财年展望 - **On**:2025财年营收同比增长30%,2025Q4营收同比增长23%;预计2026财年营收达34.4亿瑞士法郎,汇率中性下同比增长23%[12] - **Amer Sports**:2025财年营收同比增长27%,2025Q4营收同比增长28%;预计2026财年营收同比增长16%-18%,其中功能服饰与户外服饰均预计增长18%-20%[12] - **Asics**:2025财年营收同比增长20%,2025Q4营收同比增长21%;预计2026财年营收同比增长17.2%[13] - **Adidas**:主品牌汇率中性下,2025财年营收同比增长13%,2025Q4营收同比增长11%;预计2026财年营收同比增长高单位数[13] - **Columbia**:2025财年营收同比增长1%,2025Q4营收同比下降2%;预计2026财年营收同比增长1%-3%,预计26Q1收入同比下降2.5%-4.0%[13] - **Puma**:2025财年营收同比下降8%,2025Q4营收同比下降21%;预计2026财年营收同比下降低至中单位数[13]
通信行业周跟踪:英伟达业绩超预期,3月催化剂密集关注市场波动下的布局良机
山西证券· 2026-03-05 18:24
行业投资评级 - 通信行业评级:领先大市-A(维持)[1] 报告核心观点 - 英伟达业绩超预期,3月催化剂密集,关注市场波动下的布局良机[1] - AI编程智能体工作流驱动token超线性增长,B端、G端市场空间爆发在即[2] - 英伟达GTC2026大会将揭晓多项技术路线图,海外算力板块催化在即[2] - DeepSeek新品发布与MWC2026大会将开启,关注国产算力和卫星互联网机会[3][4] 行业动向与核心事件总结 - **英伟达FY2026Q4业绩超预期**:第四财季实现营收681亿美元,同比增长73%,环比增长20%;净利润430亿美元,同比增长94%,环比增长35%[2] - **数据中心业务强劲**:第四财季数据中心营收623亿美元,同比增长75%,环比增长22%;其中网络产品营收110亿美元,同比增长263%,环比增长34%[2] - **未来增长指引乐观**:英伟达对2027财年第一财季营收指引为780亿美元左右,高于市场预期[2] - **Blackwell GPU出货与未来销售预期**:过去四个季度累计出货600万颗Blackwell GPU,Blackwell+Rubin平台预计销售额将超过5000亿美元[2] - **GTC2026大会前瞻**:预计3月中旬公布CPO、LPU、Feynman架构最新路线图;Rubin平台将在算力、HBM、光连接等方面全面升级[2] - **CPO/NPO技术关注点**:市场对CPO渗透率及光模块厂商参与度存在分歧,GTC2026有望提供更明确信息;Rubin Ultra将首次尝试Kyber机柜架构,CPO/NPO在柜内光的预期行情或于2026年开始体现[2] - **DeepSeek v4即将发布**:预计为支持图片、视频、文本生成的原生多模态大模型,性能将大幅提升,并可能原生适配国产芯片(如昇腾)[3][4] - **MWC2026大会看点**:将于3月2日至5日举行,主题围绕AI与通信,主要看点包括AI终端、6G、光通信、卫星通信[4] - **卫星互联网再受关注**:近期地缘冲突凸显卫星通信作用,板块经历调整后具备再启动可能,看好通信载荷、星间激光、手机直连卫星芯片等赛道[4] 市场行情回顾总结 - **整体市场表现**:本周(2026.02.23-2026.02.27)市场整体上涨,申万通信指数涨4.76%,表现领先于主要股指(深圳成指涨2.80%,上证综指涨1.98%,科创50涨1.20%,沪深300涨1.08%,创业板指涨1.05%)[5] - **细分板块表现**:周涨幅前三的板块为IDC(+36.44%)、连接器(+11.39%)、光缆海缆(+9.11%)[5] - **个股涨跌幅**:涨幅前五为润泽科技(+35.15%)、瑞可达(+30.71%)、高澜股份(+24.31%)、烽火通信(+23.80%)、亨通光电(+23.38%);跌幅前五为网宿科技(-10.30%)、长芯博创(-5.33%)、太辰光(-5.15%)、英维克(-4.10%)、数据港(-3.29%)[5] 投资建议与关注方向 - **CPO/NPO光引擎**:建议关注中际旭创、新易盛、天孚通信、环旭电子、源杰科技[5] - **柜内光无源器件**:建议关注太辰光、天孚通信、致尚科技、唯科科技、长芯博创、仕佳光子、蘅东光[5] - **国产算力**:建议关注华丰科技、华工科技、寒武纪、摩尔线程、沐曦股份、天数智芯、盛科通信[5] - **卫星互联网**:建议关注航天电子、信科移动、烽火通信、上海瀚讯、长江通信、智明达、电科蓝天、电科芯片[5]
通信行业:英伟达业绩超预期,3月催化剂密集关注市场波动下的布局良机
山西证券· 2026-03-05 15:55
行业投资评级 - 领先大市-A(维持)[1] 核心观点 - 英伟达FY2026Q4业绩超预期,数据中心及网络业务表现亮眼,预示铜连接、1.6T光模块等产业链公司25Q4、26Q1有望实现显著环比增长[4][14] - 3月催化剂密集,包括英伟达GTC2026大会将揭晓CPO、LPU、Feynman等最新技术路线图,以及DeepSeek新品发布和MWC2026大会,关注海外算力、国产算力及卫星互联网等板块的布局机会[1][5][6][7][15][16][17] 周观点和投资建议 周观点 - **英伟达业绩强劲**:FY2026Q4营收681亿美元,同比增长73%,环比增长20%,净利润430亿美元,同比增长94%,环比增长35%[4][14] - **数据中心业务超预期**:第四财季数据中心营收623亿美元,同比增长75%,环比增长22%,其中网络产品营收110亿美元,同比增长263%,环比增长34%[4][14] - **未来增长指引乐观**:公司对2027财年第一财季营收指引为780亿美元左右,超出市场预期,过去四个季度已累计出货600万颗Blackwell GPU,Blackwell+Rubin平台预计销售额将超过5000亿美元[4][14] - **AI驱动增长**:AI编程智能体工作流的token增长具有超线性、多线程、不可预测特性,将是中短期token增长的主要驱动,B端、G端市场空间爆发在即[4][14] - **GTC2026技术展望**:大会将展示Rubin平台细节,包括NVL8、VR NVL72等多种SKU,在算力、HBM、光连接等方面全面升级,并有望明确CPO渗透率及光模块厂商参与度等市场分歧[5][15] - **下一代架构演进**:2027年推出的Rubin Ultra可能采用正交背板和CPO/NPO两种互联方式,其Kyber机柜架构是下一代Feynman GPU的主要形态,CPO/NPO在柜内光的预期行情或于2026年开始体现[5][15] - **国产算力与卫星互联网机遇**:DeepSeek v4多模态大模型即将发布,可能原生适配国产芯片,意味着国产芯片在推理市场已具备生产级能力[6][7][16][17] - **MWC2026看点**:大会聚焦AI终端、6G、光通信、卫星通信,近期地缘冲突凸显卫星遥感与通信作用,卫星板块经历调整后具备再启动可能,看好通信载荷、星间激光、星载算力服务器等赛道[7][17] 建议关注 - **CPO/NPO光引擎**:中际旭创、新易盛、天孚通信、环旭电子、源杰科技[8][18] - **柜内光无源器件**:太辰光、天孚通信、致尚科技、唯科科技、长芯博创、仕佳光子、蘅东光[8][18] - **国产算力**:华丰科技、华工科技、寒武纪、摩尔线程、沐曦股份、天数智芯、盛科通信[8][18] - **卫星互联网**:航天电子、信科移动、烽火通信、上海瀚讯、长江通信、智明达、电科蓝天、电科芯片[8][18] 行情回顾 市场整体行情 - 本周(2026.02.23-2026.02.27)市场整体上涨,申万通信指数涨4.76%,表现领先于深圳成指(+2.80%)、上证综指(+1.98%)、科创50指数(+1.20%)、沪深300(+1.08%)和创业板指(+1.05%)[8][18] 细分板块行情 - 周涨幅最高的前三板块为IDC(+36.44%)、连接器(+11.39%)、光缆海缆(+9.11%)[8][18] 个股公司行情 - **涨幅领先个股**:润泽科技(+35.15%)、瑞可达(+30.71%)、高澜股份(+24.31%)、烽火通信(+23.80%)、亨通光电(+23.38%)[8][31] - **跌幅居前个股**:网宿科技(-10.30%)、长芯博创(-5.33%)、太辰光(-5.15%)、英维克(-4.10%)、数据港(-3.29%)[8][31]
刚刚,梁文锋署名开源「记忆」模块,DeepSeek V4更细节了
36氪· 2026-01-13 08:42
公司技术发布 - DeepSeek与北京大学合作发布新论文《Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models》,提出条件记忆(conditional memory)新概念,以解决现有Transformer架构缺乏原生知识查找机制的问题 [1][3] - 公司提出并实现了一个名为“Engram”的新模块,旨在与混合专家(MoE)的条件计算形成互补,相关代码已在GitHub开源,项目获得167个星标和5个分支 [3][4][5] - 结合此前发布的《mHC: Manifold-Constrained Hyper-Connections》研究,DeepSeek v4模型的架构设计已愈发清晰 [8] 技术创新与架构 - Engram模块的设计目标是将静态模式存储与动态计算过程从Transformer主干网络中分离并增强,对序列中每个位置依次执行检索与融合两个功能阶段 [10] - 在检索阶段,通过提取与压缩当前位置的后缀N-gram,并使用确定性哈希机制以O(1)时间复杂度检索静态嵌入向量 [12] - 在融合阶段,通过上下文感知门控机制对检索到的静态嵌入进行动态调整,并用轻量级卷积操作精炼,最后与多分支架构集成 [12][14] - 该架构通过分词器压缩(将128k词表规模缩减约23%)和多头哈希等方法,解决了对所有可能N-gram组合进行参数化在计算和存储上不可行的问题 [13] 系统效率与扩展性 - Engram采用的确定性检索机制支持将参数存储与计算资源解耦,不同于MoE的动态路由,其检索索引完全由输入token序列决定,支持专门的优化策略 [15] - 在训练阶段,采用模型并行将大规模嵌入表分片分布在多GPU上,通过All-to-All通信收集激活的嵌入行,使总可用记忆容量能随加速器数量线性扩展 [17] - 在推理阶段,支持“预取-重叠”策略,可提前从主机内存异步预取嵌入向量,并利用前序Transformer层的计算缓冲来掩盖通信延迟 [17] - 利用N-gram的Zipfian分布特性,可构建多级缓存层次结构,将高频嵌入缓存于GPU HBM或主机DRAM,低频模式存于NVMe SSD,从而扩展到极大规模记忆容量且对延迟影响最小 [18] 性能表现与实验结果 - 在总参数量267亿、激活参数量38亿的同等条件下,Engram-27B模型在多项基准测试中性能显著优于纯MoE-27B基线模型 [8][28] - 具体性能提升包括:知识检索任务(MMLU提升+3.4、CMMLU提升+4.0)、通用推理能力(BBH提升+5.0、ARC-Challenge提升+3.7)以及代码与数学推理任务(HumanEval提升+3.0、MATH提升+2.4) [9][28] - Engram能够将静态知识重建负担从模型浅层剥离,有效加深网络用于复杂推理的有效深度,并通过释放注意力机制容量来显著提升长上下文检索能力(如Multi-Query NIAH准确率从84.2提升至97.0) [9][30] - 在包含2620亿token的语料库上预训练后,Engram-27B在大多数基准测试上超越了同等FLOPs的Dense-4B和MoE-27B模型,Engram-40B(总参数量395亿)进一步减少了预训练损失并提高了大多数基准测试的性能 [27][28][29] 扩展规律与稀疏性分配 - 研究发现MoE(条件计算)与Engram(条件记忆)之间的稀疏参数分配存在一条呈U型的最优扩展规律,用以刻画神经计算与静态记忆之间的最优权衡关系 [8][19] - 在总参数量和训练计算量固定的条件下,将大约20%-25%的稀疏参数预算重新分配给Engram能获得最佳性能,纯MoE基准被证明是次优的 [22][23] - 定量分析显示,在100亿参数范围内,验证损失从纯MoE的1.7248改善到最优分配时的1.7109(Δ = 0.0139) [23] - 在固定MoE主干(总参数量约30亿,激活参数量5.68亿)上附加Engram表并扩展槽数,验证损失随内存槽数量增加遵循严格的幂律持续改善,表明Engram提供了可预测的扩展旋钮 [21][23] 长上下文能力分析 - Engram通过将局部依赖建模卸载至静态查找,为处理全局上下文保留了宝贵的注意力容量,从而在长文本任务中带来显著性能增益 [30] - 在严格控制基础模型能力的对比测试中,Engram-27B在等损耗设置和等计算量设置下,均在长上下文检索和推理任务上显著超越MoE-27B基准模型 [31][32][33] - 即使在仅使用约82%计算量的极端设置下,提前停止训练的Engram-27B在LongPPL指标上与完整训练的MoE-27B持平,并在RULER测试中实现超越 [33]
刚刚,梁文锋署名开源「记忆」模块,DeepSeek V4更细节了
机器之心· 2026-01-13 08:12
文章核心观点 - DeepSeek与北京大学合作发布新研究,提出“条件记忆”作为大语言模型稀疏化的新维度,并通过新模块“Engram”实现,旨在解决现有Transformer架构缺乏原生知识查找机制的问题 [1][2][3] - 条件记忆与混合专家模型的条件计算形成互补,研究发现了MoE与Engram之间最优分配的U型扩展规律,在等参数量、等FLOPs条件下,集成Engram的模型性能显著优于纯MoE基线 [7][8][9][10] - Engram模块通过确定性的哈希检索机制,能以O(1)时间复杂度完成知识查找,并将存储与计算解耦,在系统层面实现高效扩展,有望成为下一代稀疏大模型的核心建模原语 [8][11][12] 技术方案:Engram模块设计 - **核心架构**:Engram模块在结构上将静态模式存储与动态计算从Transformer主干网络中分离,对序列每个位置依次执行检索与融合两个功能阶段 [12][14] - **检索机制**:采用基于哈希N-gram的稀疏检索,首先对当前位置后缀进行提取与压缩,并通过哈希以确定性方式检索静态嵌入向量,此过程引入词表投影将有效词表规模缩减约23% [14][15] - **融合机制**:检索后引入上下文感知门控机制,对检索到的静态嵌入向量进行动态调整和精炼,以适应当前上下文并减少噪声干扰 [16][17] 系统效率与扩展优势 - **计算存储解耦**:Engram的确定性检索机制支持将参数存储与计算资源解耦,不同于MoE的动态路由,其检索索引完全由输入决定,支持训练时的模型并行和推理时的预取-重叠策略 [18][20] - **分层缓存设计**:利用N-gram的Zipfian分布特性,构建多级缓存层次结构,将高频嵌入存于GPU HBM或主机DRAM,低频模式存于NVMe SSD,从而支持极大规模记忆容量扩展 [21] - **几乎零开销**:确定性的寻址方式支持从主机内存预取,几乎不会带来额外性能开销 [11] U型扩展规律与稀疏性分配 - **最优分配比例**:在总参数量和训练计算量固定下,研究发现了MoE与Engram分配比例与验证损失间的U型关系,将约20%-25%的稀疏参数预算分配给Engram能获得最佳性能 [24][26][27] - **纯MoE次优**:实验表明纯MoE基准是次优的,在10B规模范围内,将稀疏参数预算的约80%分配给MoE,约20%分配给Engram时,验证损失从1.7248改善至1.7109 [26][27] - **无限记忆扩展**:在固定MoE主干上激进扩展Engram记忆槽数量,验证损失持续稳定改善,且遵循严格的幂律,表明Engram提供了可预测的、无需额外计算的扩展能力 [25][27] 实验结果:模型性能对比 - **实验设置**:训练了Dense-4B、MoE-27B、Engram-27B和Engram-40B四个模型,在包含2620亿token的语料库上预训练,激活参数量严格匹配 [33][34][35] - **全面性能提升**:在等参数量、等FLOPs条件下,Engram-27B在所有基准测试中持续优于MoE-27B,提升不仅限于知识任务(如MMLU提升+3.0,CMMLU提升+4.0),在通用推理(如BBH提升+5.0,ARC-Challenge提升+3.7)及代码数学推理(如HumanEval提升+3.0,MATH提升+2.4)上更为显著 [10][37] - **扩展有效性**:扩展至Engram-40B进一步降低了预训练损失,并提高了大多数基准测试性能,表明扩展的记忆容量尚未在当前token预算内完全饱和 [38] 长上下文能力分析 - **架构优越性**:在控制基础模型能力的前提下,Engram在长上下文任务中表现出显著增益,例如在多查询NIAH任务中准确率从84.2提升至97.0 [10][44] - **等损耗设置对比**:当预训练损失对齐时,Engram-27B在复杂检索任务上大幅超越MoE-27B基准(多查询NIAH:97.0 vs 84.2;变量跟踪VT:87.2 vs 77.0) [45] - **注意力容量释放**:通过将局部依赖建模卸载至静态查找,Engram为处理全局上下文保留了宝贵的注意力容量,从而提升了长程检索和推理能力 [40] 表示对齐与收敛速度 - **加速收敛**:基于LogitLens的逐层KL散度分析显示,在模型浅层KL散度持续保持较低水平,表明Engram加速了预测的收敛 [44] - **有效深度增加**:基于CKA计算的相似度热力图显示,Engram浅层在功能上等效于MoE模型的深层,从而有效地增加了模型的有效深度 [44]