事件概述 - DeepSeek或将于2月发布新一代旗舰AI模型DeepSeek V4 [1] - 内部初步测试表明,V4在编程能力上超过了Anthropic的Claude和OpenAI的GPT系列 [1] 核心技术突破:Engram模块 - Engram模块是V4架构的核心突破,是一个巨大的、可扩展的嵌入表,为Transformer增加外接记忆库 [2] - 该模块实现了“查算分离”,将实体名、通用常识等静态知识存入可扩展查找表,实现O(1)级快速检索,让MoE专家层聚焦复杂推理 [2] - 该技术将大模型20%-25%的静态知识参数从GPU显存迁移至主机内存,重塑了模型的存储需求结构 [3] - 同等参数规模下,模型对高成本HBM的依赖强度显著下降 [3] - 系统可在GPU执行计算时异步预取DRAM数据,使DRAM成为承载“温数据”的核心层级,单节点存储容量有望从1-2TB翻倍至4TB以上 [3] 对产业链的潜在影响 - 技术变革直接带动服务器对高频DDR5、MRDIMM及CXL存储池化技术的需求爆发 [3] - 推动AI应用场景下SSD用量进入高速增长通道 [3] - 相关SSD存储标的包括江波龙、德明利、佰维存储 [9] AI编程的战略意义与市场前景 - AI编程是当前B端应用落地最成熟和最主流的赛道 [4] - Anthropic的AI编程工具Claude Code在发布仅6个月后年度化收入就达到了10亿美金 [4] - 根据OpenRouter数据,AICoding占据全球token总消耗的50% [4] - 国产开源大模型有利于提升国产IDE的使用频次和深度 [4] - 低代码平台同样受益于国产大模型的发展,可将智能化场景合理拆分,分阶段推进 [4] - 相关应用厂商标的包括合合信息、万兴科技、京北方、宇信科技、华宇软件、卫宁健康、创业慧康、嘉和美康、用友网络、金蝶国际等 [9] V4版本的其他潜在关注点 - 关注V4是否会发布蒸馏版本以提升AI应用使用性价比,蒸馏版本可适用于多种算力芯片,利好消费电子 [5] - 关注API定价是否会大幅低于其他主流大模型 [5] - 关注V4在多模态上是否有重要更新 [5] - 关注V4是否进一步支持国产芯片架构,DeepSeek在V3.1时已公开使用针对国产芯片设计的UE8M0 FP8 Scale参数精度 [5] - 国产大模型和国产芯片之间的协同将有效加速国内AI产业发展 [5] - 相关算力基础设施标的包括寒武纪、海光信息、弘信电子、首都在线、光环新网、优刻得、科华数据、浪潮信息等 [9] 历史市场表现 - DeepSeek R1模型于2025年春节前发布,并在春节期间火爆全球 [6] - 概念股每日互动从17元附近一度最高涨至70元 [6]
Deepseek新模型有望2月发布,这些方向成潜在发酵重点
选股宝·2026-01-15 16:19