以存代算
搜索文档
【财经分析】存储芯片价格攀升 视频压缩技术需求激增
新华财经· 2026-02-12 15:09
行业核心动态 - 全球存储芯片供需失衡加剧,价格延续2025年上涨态势,主要受AI与数据中心需求增长驱动 [1] - 云服务供应商采购量指数级成长,价格敏感度较低,驱动本轮存储芯片价格涨幅超越前一次超级循环 [4] - 买方积极竞逐原厂供给,预计今年一季度通用DRAM合约价季度环比上涨90%至95%,NAND Flash合约价季度环比上涨55%至60% [4] 存储芯片涨价驱动因素 - 需求端:AI服务器单机存储需求是传统服务器的8至10倍,北美四大云服务厂商预计2026年AI基建投资达6000亿美元,带动服务器领域存储芯片消耗量同比增长40%至50% [4] - 需求端:HBM高端产品需求井喷,以存代算技术创新凸显HBM战略价值 [5] - 供给端:国际存储芯片原厂将产能优先投向HBM、DDR5等高毛利产品,同时压缩通用存储产能 [5] - 供给端:存储芯片扩产周期需1.5年至2年,2026年供应增长将低于需求增速,导致供需缺口持续扩大 [5] - 市场行为:下游厂商主动补库存行为进一步放大价格上涨弹性,形成从需求爆发到供给受限、再到补库存的正向循环 [5] 涨价对下游产业的影响 - 智能手机:小米、OPPO等品牌通过上调新机售价对冲成本压力,业内预测2026年智能手机出货量可能因价格上涨而下降 [2] - 个人电脑:联想、惠普、戴尔、华硕、宏碁等厂商因上游存储成本增加和利润考量,均已启动调价机制 [5][6] - 消费电子:内存涨价正全面传导至消费电子产业链,电脑、手机、汽车等行业均感受到压力 [5] - 企业策略:零部件成本上涨叠加消费者购买力减弱,要求原始设备制造商改变采购模式,或聚焦高端机型以支撑更高定价 [6] 视频压缩技术需求激增 - 存储芯片价格上涨及高清视频存储要求提升,放大了高清视频“存不下”的难题,导致市场对视频压缩技术需求更为迫切 [1][2] - 多家视频压缩技术企业反映客户问询量出现明显增长,客户对视频压缩解决方案的咨询量和需求量大幅提升 [1][2] - 视频压缩技术成为缓解存储成本压力的重要替代方案,通过高质量压缩技术可在存储容量不变的情况下减少视频占用空间 [2] 视频压缩技术应用与案例 - 公安系统、金融行业、电网行业等对视频存储时长要求严苛,例如常规变电站需90天连续存储,重要场所存储周期长达数年 [3] - 4K高清摄像头普及导致数据量爆发式增长,硬件成本与机房能耗压力大幅增加 [3] - 当虹科技基于BlackEye多模态空间大模型迭代视频超级压缩技术,在画质基本不变、不影响AI分析的前提下,可将10TB视频压缩为1TB,释放90%存储空间 [2] - 中科通量科技的金刚V高通量智能视频存储解决方案,依托芯片级“无损视频压缩”技术和国产RISC-V智能视频处理芯片,实现对视频流的“无损压缩”,在“人眼视觉”与“机器视觉”场景下均达到近无损标准 [3]
未知机构:AI储存调研-20260211
未知机构· 2026-02-11 09:25
行业与公司 * 涉及的行业为人工智能(AI)基础设施与算力行业,特别是大模型推理优化、存储技术及国产芯片领域[1][2][3][4][5][6][7][8][9][10][11][12][13][14][15][16][17][18][19][20][21] * 讨论内容聚焦于AI服务提供商(尤其是大型云厂商或头部模型公司)在优化Agent推理成本、存储架构及应对硬件供应链变化方面的技术实践与策略[1][2][3][4][5][6][7][8][9][10][11][12][13][14][15][16][17][18][19][20][21] 核心观点与论据 **1. AI推理优化中的“以存代算”架构** * 在Agent执行过程中,理解(规划)阶段由最强大的模型负责,执行阶段可调用不同大小的模型,并辅以工具矩阵[1][2] * 核心优化手段是“以存代算”,通过缓存历史问答的KV(Key-Value)对来避免重复计算,最高可命中**67%** 的缓存,即**100个问题中有67个**可直接从KV中获取答案[2] * 该架构将推理集群分为prefill集群和decoding集群,存储采用分层结构(HBM、DRAM、SSD),用于存放热、温、冷数据,此做法在大厂中已广泛应用[3] **2. 存储技术细节与成本考量** * 存储的核心是KV而非文本,例如**2000字**文本对应的KV可能达**2.4GB**,而文本本身仅几十KB,存储KV是为了节约算力[6] * 日志明文存储在HDD上,而推理产生的KV则存储在SSD上,SSD需支持高吞吐(每秒几GB到几十GB)[9][12] * SSD上KV的生命周期通常至少保存**90天**[11] * AI推理导致SSD读写频次远高于传统数据库模式,可能缩短其使用寿命,加速替换周期,从而推高需求[13] * “以存代算”兼具效率与经济性考量,从存储抽取数据回溯的速度至少是逐token生成的**3倍**[14] * 该技术是AI推理降本的核心驱动力之一,以国内某头部模型为例,**2025年年初到年末,其推理成本下降了40%到60%**[14] * SSD现货价当前约为**0.3美金/GB**,若价格上涨至当前的**2到2.5倍**,“以存代算”的性价比将面临较大压力;若涨至**2.5到3倍**(即约**0.75到0.9美金/GB**),相关价格体系需重新调整[17][18][21] * 性价比逻辑在于节省的推理成本与存储成本的对比,若存储价格上涨导致成本节省幅度从**60%** 降至**5%到10%**,则“以存代算”意义不大[21] **3. 硬件供应链与国产化趋势** * 高端GPU(如H200)进口政策为“总量控制、分类管理、精准调控”,仅头部大模型训练企业有资格申请配额,通道未关闭但总量减少[15] * 政策目标明确:一是通过定向采购缩短国内外AI能力差距;二是保护国产芯片,避免海外产品大规模冲击[16] * **2026年**将要求大厂在采购英伟达芯片时,同步测试甚至采购国产芯片,国家持积极扶持态度[16] * **2026年至2027年上半年**被视作关键窗口期,国产芯片需从“基本可用”迈向“整体好用”[16] * 面对SSD价格上涨压力,供应链需寻求多样化,国产替代是缓冲压力的重要手段[20] 其他重要内容 * 缓存命中率存在天花板,约在**60%到70%**,因AI服务需兼顾共性回复与差异化输出[4] * 对C端用户的缓存建模主要是一对一,但会从海量数据中挖掘共性问题[5] * “以存代算”中的缓存命中是全局性的,系统会检查是否有已存储的对应问题-答案KV对[6] * 技术优化会避免计算量与存储量呈简单的线性乘法关系,而是通过优化压缩系数[7] * 存储涨价中,SSD涨幅比DRAM更明显,因它是长链路缓存的最终承载瓶颈[8] * DRAM在缓存架构中仅存**几个小时**的数据,读写频次非常高[13]
AI Agent正加速从概念走向规模化落地,软件ETF(159852)获资金关注
新浪财经· 2026-02-02 10:51
板块与指数表现 - 2026年2月2日早盘,软件开发板块震荡调整,截至10:21,中证软件服务指数下跌0.81% [1] - 成分股涨跌互现,三六零领涨4.61%,石基信息上涨3.67%,朗新科技上涨3.01% [1] - 云天励飞领跌,深信服、达梦数据跟跌 [1] - 截至2026年1月30日,中证软件服务指数前十大权重股合计占比60.27% [2] 行业动态与产品发布 - 阿里正式推出面向桌面办公的本地化智能Agent工具QoderWork,采用系统级文件权限设计,任务全程在用户终端完成,无需上传数据至云端 [1] - 该产品基于MCP协议构建开放工具生态,支持自然语言指令驱动文件整理、数据清洗、PPT/视频生成等复杂任务 [1] - 这标志着国内头部厂商正加速构建“端—边—云”协同的AI原生软件范式,有望重塑办公软件竞争格局与用户交互习惯 [1] AI Agent技术发展趋势 - AI Agent正加速从概念走向规模化落地,其系统级架构对底层软件栈提出全新要求 [2] - 现代Agent需同时运行成百上千个独立环境实例,操作系统调度压力陡增,沙盒隔离、KV缓存卸载、高并发工具调用等任务高度依赖CPU算力与内存带宽,推动“以存代算”范式兴起 [2] - DeepSeek Engram架构将超大规模记忆体运行于CPU内存,Anthropic Claude Cowork引入永久知识库,均印证CPU正从传统计算单元转向AI时代的协同中枢 [2] 相关投资工具 - 软件ETF(159852)跟踪中证软件服务指数,是掘金计算机软件行业的便利工具 [3] - 场外投资者还可以通过软件ETF联接基金(012620)布局AI软件投资机遇 [4]
优必选开源具身智能大模型Thinker,AI人工智能ETF(512930)开盘涨超1.1%
新浪财经· 2026-02-02 10:05
市场表现 - 截至2026年2月2日09:38,中证人工智能主题指数(930713)强势上涨1.18% [1] - 指数成分股新易盛上涨11.83%,三六零上涨8.48%,润泽科技上涨3.40%,中科星图、澜起科技等个股跟涨 [1] - AI人工智能ETF(512930)上涨1.14%,最新价报2.4元 [1] 指数与产品构成 - AI人工智能ETF紧密跟踪中证人工智能主题指数 [2] - 中证人工智能主题指数选取50只业务涉及为人工智能提供基础资源、技术以及应用支持的上市公司证券作为指数样本 [2] - 截至2026年1月30日,指数前十大权重股分别为中际旭创、新易盛、寒武纪、澜起科技、科大讯飞、中科曙光、海康威视、豪威集团、芯原股份、金山办公 [2] - 前十大权重股合计占比57.27% [2] - AI人工智能ETF(512930)设有场外联接基金,包括平安中证人工智能主题ETF发起式联接A(023384)、C(023385)、E(024610) [2] 行业动态与技术创新 - 优必选宣布开源其自研的具身智能大模型Thinker,该模型以“小参数、高性能、全开源”为特点,旨在为工业人形机器人提供快速反应与精准空间感知的下一代具身智能大脑 [1] - 国金证券指出,DeepSeek推出的Engram架构把大模型里的“计算”和“超大规模记忆”解耦,Transformer的算子在GPU/加速卡上计算,而1000亿参数的Engram表存储运行则在CPU内存中 [1] - Anthropic推出的Claude Cowork是一种通过知识库为Claude设计的全新永久记忆方式 [1] - 类Engram架构能有效突破GPU显存限制,从而推动以存代算需求和CPU配比提升 [1]
计算机:AI进入新临界点
国金证券· 2026-02-01 18:29
报告行业投资评级 * 报告未明确给出统一的行业投资评级,但通过列举大量相关标的并分析行业趋势,隐含了对AI Agent、算力、存储及CPU等细分领域的积极看法 [4] 报告核心观点 * AI Agent生态持续扩张,正从简单的对话模型向能并行处理复杂任务的智能体集群演进,这将重塑计算架构,并催生对CPU和存储的新一轮刚性需求 [6] * 在Agent驱动的强化学习时代,计算瓶颈正从GPU向CPU转移,主要源于多智能体调度、长上下文KV缓存卸载以及高并发工具调用三大逻辑 [6] * Agent的执行过程需要大量记忆和上下文缓存,推动了存储需求增长,利用SSD进行KV缓存卸载成为解决GPU显存瓶颈、提升推理性能的关键技术路径 [6] * DeepSeek的Engram等“以存代算”架构通过解耦计算与记忆,进一步凸显了CPU和大容量内存的重要性 [6] 根据相关目录分别总结 一、Agent生态持续扩张 * 大模型公司Anthropic大幅上调营收预测,预计今年销售额将增长四倍达180亿美元,明年达550亿美元,其AI编码助手Claude Code在去年11月的年化收入已超过10亿美元 [6][11] * 月之暗面发布并开源K2.5模型,其核心亮点是支持多达100个Agent分身并行处理1500个步骤,能自主完成如阅读40篇论文并撰写长篇综述的复杂任务 [6][12] * AI助手Clawdbot近期爆火,能接管个人终端的邮件、日历、值机等各类任务,并通过常用聊天APP发送指令,其“贾维斯”式体验为Agent形态打开了新思路,吸引了腾讯云、阿里云等厂商快速接入 [6][14][15] 二、三大逻辑揭示Agent对CPU的刚性需求 * **Multi-Agent架构引发OS调度压力**:Agent的“推理-执行-反思”循环机制需要操作系统频繁调度,且其运行常依赖CPU算力密集的沙盒环境 [6][16] * **长上下文场景下KV Cache卸载对CPU的挑战**:为解决GPU显存瓶颈,业界将KV Cache数据迁移至CPU内存,这要求CPU具备大内存并承担繁重的调度与传输任务 [6][16] * **高并发工具调用带来的CPU算力消耗**:检索、编码等非模型推理任务主要由CPU执行,高并发场景下多线程/多进程处理推高了CPU负载 [6][20] * 佐治亚理工学院论文数据显示,在五大代表性Agent工作负载中,CPU端的工具处理占延迟的43.8%至90.6%,而LLM推理仅占较小部分,例如HaystackRAG任务中检索耗时8.0秒占总延迟90.6% [21] 三、Agent驱动存储需求持续增长 * Agent的执行过程需要记忆和上下文缓存,对存储带来巨大需求,利用SSD进行KV Cache Offloading可解决GPU显存瓶颈、提高推理性能并降低成本 [6][31] * 在Agent多轮对话环境中,将KV缓存卸载至NVMe SSD等共享存储,可实现跨节点快速恢复,避免会话迁移时重新预填充引入的高延迟 [36] * 美国存储厂商近期业绩亮眼:希捷第二财季营收同比增长22%至28.3亿美元,并给出高于市场预期的下季度指引 [40];闪迪第二财季营收达30.25亿美元,同比增长61%,GAAP净利润同比增长672%至8.03亿美元,并预计数据中心将在2026年首次成为NAND最大市场 [41] 四、相关标的 * 报告列出了覆盖海外算力/存储、国内算力、CPU等多个赛道的广泛标的清单,包括中际旭创、新易盛、兆易创新、海光信息、中科曙光、澜起科技、闪迪、美光等数十家公司 [4][42]
最稳定的Memory、液冷产业信息
傅里叶的猫· 2026-01-30 23:50
闪迪公司最新财务与业务表现 - 公司第三财季总营收达30亿美元,环比增长31% [1] - 公司第三财季毛利率达51.1%,环比提升21个百分点 [1] - 公司数据中心业务营收环比大增64%,占总营收的15% [1] - 管理层预计后续季度将完成更多超大规模云服务商的认证工作 [1] - 公司对FY3Q26的营收指引中点为46亿美元,每股收益指引为13美元,贴合市场高位预期 [1] NAND/SSD行业需求的底层逻辑 - 以存代算:存储成为AI推理关键使能器,通过KV Cache持久化降低算力消耗 [3] - Sandisk CEO提及token intensity在加速,并估算KV cache在2027年将带来额外75-100 EB需求,一年后翻倍 [3] - 数据生成主体改变:从人类生产转向模型自生成,不受物理边界限制 [3] - Sandisk提及数据增长因“数据温度上升”而加速,对应更多数据值得被持久化存储 [3][4] - 数据重用价值提升:LLM/RAG技术唤醒历史数据,使存储率从过去的1%大幅提升 [8] - 企业级SSD加速采用,数据中心预计在2026年成为NAND最大市场,带来高60s Exabyte增长 [8] - 相同语义密度下的数据通胀:数据从明文转为embedding、KV、多模态后,容量膨胀5-1000倍 [8] - Sandisk确认AI工作负载导致存储内容要求大幅提升,与数据通胀逻辑方向一致 [8] 行业趋势与定位演变 - 四大需求逻辑叠加,使SSD/NAND从冷存外设转变为持久化算力资产 [5] - SSD/NAND的增长与GPU/HBM解耦,正独立跑出其自身的Alpha增速 [5]
金鹰基金:存储芯片涨价潮延续 关注三方向投资机会
新浪财经· 2026-01-28 15:10
文章核心观点 - 全球存储芯片市场正经历“史上最强”的超级周期,其核心驱动力已从传统消费电子转向AI算力革命 [1][6] - 本轮涨价的核心原因是供给端扩产缓慢与高端AI需求虹吸共同作用的结果 [1][6] - 行业景气度预计至少延续到2026年上半年,市场对紧平衡持续到2026年之后的判断在增多 [3][8] 涨价驱动因素:供给端 - 供给端短期难以快速扩产,新建一座晶圆厂平均需要18–24个月,形成稳定可售供给时间更长 [1][6] - 海外存储厂商在上一轮下行期普遍减产控产、谨慎安排资本开支,导致库存回落、供给弹性变小 [1][6] - 即便国内存储厂商(两存)更积极,新增产能也大概率要到2026年下半年甚至更晚才会在统计口径上明显体现 [1][6] 涨价驱动因素:需求端 - 需求端出现结构性上移,AI数据中心推升了HBM、服务器内存与企业级SSD的优先级 [1][6] - 厂商资源向高毛利产品倾斜,客观上挤压了部分通用型DRAM与NAND的供给 [1][6] - 下游提前锁量、备货,进一步放大了短期紧缺和涨价斜率 [1][6] 2026年涨价新特点 - 涨价更“全面”、斜率更“陡”,从结构性短缺外溢到更主流的DDR5与客户端SSD [2][7] - 买方锁量意愿更强,机构对2026年一季度合约价的上行预期明显更激进 [2][7] - AI带来的“以存代算”逻辑强化,市场对NAND/SSD的需求想象力被抬升 [2][7] - BlueField-4等方案强调通过新增上下文存储层提升效率,可能使NAND的定价与估值框架向伴随算力成长的逻辑靠拢 [2][7] 行业景气度展望 - 从当前信息看,行业景气或至少延续到2026年上半年 [3][8] - 机构对2026年第一、二季度价格仍给出较强的上行预期 [3][8] - 供给端新增产能释放与良率爬坡都需要时间,短期供给修复并不快 [3][8] - 关键变量在于新增产能(尤其国内两存)的释放节奏,以及HBM相关先进封装/测试瓶颈的缓解速度 [3][8] 潜在投资机遇 - 首先是存储IDM(整合器件制造)厂商的利润弹性与产品结构升级带来的机会 [3][8] - 其次是围绕扩产与代际升级带来的设备、材料、零部件与先进封测环节机会 [3][8] - 需要动态跟踪价格拐点出现后,消费电子与PC链条的需求修复与库存再平衡所带来的阶段性反转机会 [3][8]
涨价超预期!存储板块多只个股股价创新高
证券日报之声· 2026-01-27 14:42
市场表现与核心驱动事件 - 2026年1月27日A股存储芯片概念板块指数涨近2% 多只个股表现强势 其中东芯股份股价“20CM”涨停 总市值达677.7亿元 协创数据大涨超8% 总市值达793.4亿元 精智达涨超7% 总市值达282.3亿元 普冉股份涨幅逼近16% 月内累计涨幅超100% 帝科股份与精测电子等多只个股月内累计涨幅超60% [1] - 存储芯片价格上涨的核心驱动事件是三星电子计划在2026年第一季度将NAND闪存供应价格上调100%以上 远超市场预期 [1] - 三星电子作为NAND市场份额第一的企业大幅涨价 显示出头部厂商在卖方市场中的强大议价能力 凸显了当前半导体市场严重的供需失衡 [1] 价格上涨趋势与供需分析 - 行业公司判断存储产品价格在2026年第一、第二季度有望持续上涨 相关产品均处于价格上涨通道 [2] - 需求端核心驱动力是人工智能技术爆发 AI服务器对高性能存储芯片需求远超普通服务器 “以存代算”趋势让HBM等高端存储产品战略价值凸显 云服务巨头与企业加大AI算力投入并提前锁定产能 加剧供需紧张 [2] - 供给端因行业下行周期后头部厂商采取保守策略 主动控产稳定价格并将产能向高附加值产品倾斜 导致通用型存储芯片供应锐减 形成高端抢货、中低端紧缺格局 技术迭代成本上升与良率波动限制了产能扩张 供应链库存处于低位及下游提前备货进一步放大价格上涨压力 [2] - 存储芯片涨价大概率将贯穿2026年 或将在2027年逐步缓解 [3] 产业链公司业绩印证行业红利 - AI需求驱动存储行业进入超级上行周期 国内存储产业链企业迎来业绩集中爆发 [3] - 兆易创新预计2025年归属于上市公司股东的净利润为16.1亿元左右 同比增长约46% 扣非净利润预计14.23亿元左右 同比增长约38% 预计2025年度营业收入92.03亿元左右 同比增长约25% 较上年新增营收18.47亿元左右 [3] - 德明利预计2025年度归属于上市公司股东的净利润为6.5亿元至8亿元 同比增长85.42%至128.21% 其中2025年第四季度单季度净利润预计为6.7亿元至8.3亿元 同比增长1051.59%至1262.41% 环比增长645.11%至810.18% [4] - 市场机构认为存储行业景气度正由下游需求端向上游封测环节传导 行业迎来量价齐升的发展行情 [4]
计算机行业点评:CPU涨价能持续多久?
国金证券· 2026-01-25 10:53
报告行业投资评级 * 报告未明确给出统一的行业投资评级,但通过详细分析行业趋势并列出大量相关标的,隐含了对该细分领域的积极看法 [4] 报告的核心观点 * 在Agent驱动的AI新时代,CPU正取代GPU成为算力基础设施的新短板,其需求将迎来爆发式增长 [6] * 三大核心逻辑驱动CPU刚性需求:Multi-Agent架构的OS调度压力、长上下文下的KV Cache卸载、高并发工具调用 [11] * Agent生态的指数级扩张将引爆CPU性能瓶颈,CPU在典型Agent工作负载中承担了大部分延迟 [16][21] * 产业供需失衡已经显现,英特尔、英伟达等巨头已采取行动应对CPU短缺,补足CPU短板是下阶段算力建设的重点 [33][37] 根据相关目录分别进行总结 一、三大逻辑揭示Agent对CPU的刚性需求 * **Multi-Agent架构带来操作系统调度压力**:Agent的“推理-执行-反思”闭环工作流导致操作系统层面的上下文切换和进程调度任务大幅增加,且运行隔离沙盒高度依赖CPU算力 [6][11] * **长上下文场景下KV Cache卸载挑战CPU**:为解决GPU显存容量瓶颈,业界采用KV Cache Offload技术将数据迁移至CPU内存,这要求CPU具备大内存并承担繁重的调度与传输任务 [6][11] * **高并发工具调用消耗大量CPU算力**:检索、编码、网页浏览等非模型推理任务主要由CPU执行,高并发场景下的多线程/多进程处理需求推高了CPU负载 [6][15] 二、Agent生态扩张引爆CPU性能瓶颈 * **Agent生态将经历指数级扩张**:据IDC预测,2025年至2030年间,活跃Agent数量、年执行任务量及年度Token消耗量的年复合增长率将分别达到139%、524%和3418% [6][16][17] * **CPU是Agent工作负载的主要延迟来源**:研究显示,在五大代表性Agent工作负载中,CPU端的工具处理占延迟的43.8%至90.6%,而LLM推理仅占较小部分,例如HaystackRAG任务中CPU耗时占比达90.6% [6][21] * **CPU能耗随负载增加而急剧上升**:在处理LangChain工作负载时,当Batch Size增加到128,CPU的能耗(1807 Joules)已非常接近GPU(2307 Joules) [27] * **新架构推动“以存代算”**:如DeepSeek的Engram架构将1000亿参数的表存储运行在CPU内存中,仅产生小于3%的开销,这类架构将推动对CPU内存和算力的需求 [6][32] 三、供需失衡全面爆发,算力木桶新短板已现 * **产业巨头紧急调整应对CPU瓶颈**:英特尔将产能紧急转向服务器CPU导致消费端交付受阻;英伟达因ARM CPU瓶颈,计划在下一代Rubin架构中大幅提升CPU核心数,并开放对x86 CPU的支持 [6][33] * **服务器与客户端CPU需求同步强劲增长**:Jon Peddie Research报告显示,2025年第二季度全球服务器CPU出货量同比增长22%,客户端CPU出货量同比增长13%,且已连续两个季度增长 [6][33] * **供应短缺持续**:英特尔CFO表示预计2026年第一季度可用供应将降至最低水平,公司正应对整个行业的供应短缺 [37] * **CPU成为算力新短板**:报告认为,在Agent时代,CPU已演变为类似存储的新短板,补足这一短板是下一阶段算力基础设施建设的重中之重 [6][37] 四、相关标的 * **CPU相关**:报告列出了包括海光信息、中科曙光、龙芯中科等在内的标的 [4][38] * **国内算力相关**:报告列出了包括寒武纪、中芯国际、浪潮信息、百度集团等在内的广泛标的 [4][38] * **海外算力/存储相关**:报告列出了包括中际旭创、新易盛、兆易创新、北方华创等在内的标的 [4][38]
大摩眼中的DeepSeek:以存代算、以少胜多!
华尔街见闻· 2026-01-22 10:48
核心观点 - DeepSeek通过创新的“Engram”模块和“条件记忆”机制,将存储与计算分离,减少了对昂贵高带宽内存的依赖,转而利用性价比更高的普通系统内存,正在改写AI的扩展法则,证明高效的混合架构是下一代AI的决胜点 [1] 技术架构创新 - DeepSeek的“Engram”模块基于“条件记忆”原则,将静态模式存储与动态推理分离,将模型的静态知识卸载到CPU或系统内存中,仅在需要时检索,从而大幅减少对HBM的需求 [1][3] - 该架构解决了当前AI基础设施中最昂贵的HBM瓶颈,通过在现有硬件架构下提升效率,有效减少昂贵的硬件升级需求 [3] - 这种设计为大语言模型解锁了新的效率水平,是一种无需重载HBM即可高效查找基本信息的方法,从而释放HBM容量用于更复杂的推理任务 [3] 硬件成本与经济学影响 - Engram架构通过减少对高速内存的需求,使基础设施成本可能从昂贵的GPU向更具性价比的DRAM转移 [5] - 一个1000亿参数的Engram模型在FP16/BF16精度下,最低需要约200GB的系统DRAM [5] - 相比英伟达Vera Rubin系统每个CPU配备的1.5TB DRAM,DeepSeek的架构意味着每台系统对商品化DRAM的使用量将增加约13% [5] - 计算适中但内存巨大的配置,可能比单纯的GPU扩展提供更高的“每美元性能” [7] - 推理能力的提升超过了知识获取的增益,表明内存的价值已延伸至计算之外 [7] 性能表现与行业影响 - 尽管在先进算力等方面受限,中国领先的AI模型在过去两年迅速缩窄了与全球前沿模型的性能差距,这被归结为“约束诱导的创新” [5][6] - DeepSeek V3.2在MMLU基准测试中得分约为88.5%,在编码能力上约为72%,在推理和效率方面展现出强大竞争力 [5][6] - 中国AI的进步可能越来越不取决于直接缩小硬件差距,而是取决于绕过硬件瓶颈的算法和系统级创新 [8] - 通过将内存与计算解耦,中国正在构建不仅更聪明而且结构更高效的大语言模型 [8] 未来展望与市场应用 - 利用Engram内存架构,DeepSeek的下一代模型V4在发布时预计将实现重大飞跃,特别是在编码和推理方面 [8] - 该模型极有可能在消费级硬件上运行,消费级显卡可能就足够,这意味着高水平AI推理的边际成本将进一步降低,使AI应用能更广泛部署而无需完全依赖昂贵的数据中心级GPU [8] - 摩根士丹利基于此技术趋势,重申了对中国内存和半导体设备本土化主题的看好 [8]