Ingram模块
搜索文档
未知机构:大摩闭门会DeepSeek新模型解读260121-20260123
未知机构· 2026-01-23 10:10
涉及的行业与公司 * **行业**:人工智能(AI)、半导体(芯片、存储、设备)、投资银行(估值分析) * **公司**: * **AI公司**:DeepSeek(深度求索)、QN3、豆包C 1.8、minimaxm2、doubleseed 1.8 * **半导体产业链公司**:NATechnology Group Co. Ltd.、JCET Group Co. Ltd.(长电科技)、Advance Micro Fabrication Equipment Inc. (AMEC)(中微公司) * **对比公司**:OpenAI(ChatGPT 5.2) 核心观点与论据 1. AI技术架构创新:n-gram/Ingram模块 * **核心创新**:通过**存储与计算分离**,将静态知识存储在条件内存中,与动态计算解耦[1][2][4][15][16][17][19] * **关键优势**: * **降低对HBM的依赖**:减少对昂贵高带宽内存(HBM)的需求,将模型参数存储在普通DRAM中[1][2][3][5][6][15][16] * **提升效率与降低成本**:仅需约**200GB DRAM**即可实现良好推理表现,显著降低硬件门槛和基础设施成本[3][4][17] * **优化资源分配**:将复杂计算转化为低成本的内存存储,使模型在较少GPU下发挥更大效能[4][19] * **提升模型能力**:在不增加计算量和参数的情况下,提升模型准确率,尤其优化长文本推理和检索能力[2][9][21] 2. 对中国AI行业的影响与战略意义 * **效率驱动创新**:在硬件资源受限条件下,通过算法优化和系统级创新(如稀疏混合专家模型、长上下文注意力机制)缩小与国际顶尖模型的差距[2][4][7][19][20] * **改变竞争格局**:推动中国AI生态从依赖算力竞赛转向关注**算法效率和系统优化**,走出一条成本更低、可扩展性更强的道路[7][20][21] * **提升全球竞争力**:为中国AI公司提供了在不依赖最先进芯片的情况下,追赶美国顶级模型的机遇[2][10][22] * **具体性能对比**:中国主流AI模型(如DeepSeek v3.2、QN3)在多项关键指标上表现出色,例如在MMLU测试中超过**90%**,在GPQA和编码测试中达到**88%**以上,并在上下文长度(**128K到256K**)、多模态支持和开源性方面有优势[8][21] 3. 对半导体产业链的影响与投资机会 * **需求转移**:n-gram技术提升了对**DRAM**的需求,为IDM厂商、模块制造商、DRAM颗粒及主控芯片厂商带来新机遇[5][6][20] * **产业链受益**:测试与封测环节的重要性凸显,半导体设备公司(如AMEC)和封装公司(如JCET)将受益于国产替代和芯片设备国产化趋势[3][6] * **推动硬件普及**:下一代模型(如DeepSeek V4)目标在消费级硬件(如RTX 5090)上运行,将加速AI市场普及[3][18] 4. 相关上市公司估值分析与风险因素 * **通用估值方法**:主要采用**剩余收入模型**进行评估[12][13][14][22][23] * **NATechnology Group估值核心假设与风险**: * **核心假设**:权益成本 **8.6%**,中期增长率 **14%**,永续增长率 **5%**[12][22] * **超预期因素**:中国半导体资本支出周期强劲、研发进展快速抢占市场份额、芯片制造产能紧张[12][22] * **低于预期风险**:半导体投资降温、市场份额下降、下游需求疲软导致芯片过剩[12][22] * **JCET Group估值核心假设与风险**: * **核心假设**:权益成本 **8.6%**,中期增长率 **12.5%**,永续增长率 **4%**[13][23] * **超预期因素**:下游需求旺盛、先进封装技术提前大规模应用、市场份额快速提升[13][23] * **低于预期风险**:需求疲软、技术进度滞后、市场份额增长缓慢[13][23] * **AMEC估值核心假设与风险**: * **核心假设**:股权成本 **6.2%**,中期增长率 **14%**,永续增长率 **4%**[14][23] * **超预期因素**:行业景气度提升、新产品开发加速、国内需求加速释放[14][23] * **低于预期风险**:市场需求疲软、价格战、产品开发进度延迟、国内扩产节奏放缓[14][23] 其他重要内容 * **技术细节**:n-gram嵌入系统根据最近**2到3个token**的后缀通过哈希函数以**O(1)**时间复杂度获取embedding,并与隐藏状态融合[9][21] * **架构对比**:Ingram的分层内存设计与RAG(外部检索)和KVCache(临时存储)有本质区别,更适合静态知识密集型任务[11][22] * **发展计划**:DeepSeek V4将继续沿用n-gram架构,重点提升**编码及逻辑推理能力**[2][3][18] * **宏观背景**:讨论中提及了加权平均资本成本(WACC)、市场风险溢价等估值参数[1][12]