Workflow
AI存储
icon
搜索文档
AI存储,再度爆火
半导体行业观察· 2025-10-02 09:18
文章核心观点 - AI的飞速发展使存储成为与算力同等重要的关键环节,HBM、HBF和GDDR7三种存储技术正在重新定义AI基础设施的未来格局 [1] - 这三种技术的竞合演进关乎存储产业数千亿美元的市场格局,并决定着人工智能能否突破当前技术天花板,迈向通用人工智能新纪元 [1] - 没有一种存储技术能够包打天下,HBM、HBF、GDDR7在特定领域发挥着不可替代的作用,反映出AI产业对存储需求的多样化和精细化 [23] HBM(高带宽内存)技术发展 - HBM通过3D堆叠技术实现超高带宽存储,已成为决定AI芯片性能上限的关键因素,从H100的80GB容量、3.4TB/s带宽提升到GB300的288GB容量、8.0TB/s带宽,不到三年实现容量超两倍、带宽约2.5倍的提升 [3] - SK海力士凭借技术和市场双重优势稳居霸主地位,已进入HBM4最终测试阶段并向英伟达供应样品,同时宣布完成下一代HBM4内存开发并具备全球首个大规模量产条件 [3] - 三星电子在HBM4性能方面有信心,采用4纳米代工工艺应用于逻辑芯片,但测试进度落后竞争对手约两个月,在快速迭代的AI市场中可能造成致命影响 [3] - HBM正向定制化(cHBM)发展,SK海力士已锁定英伟达、微软、博通等重量级客户开展定制设计,从第七代HBM(HBM4E)开始将全面转向定制化路线 [4] - 定制化HBM的核心在于将基础芯片功能集成进由SoC团队设计的逻辑芯片中,赋予设计人员更大灵活性,可更紧密集成内存与处理器芯片,并根据具体应用优化功耗、性能与面积 [4] - 三星电子发起“背水一战”,在董事长李在镕支持下为HBM业务投入全部精力,正量产HBM4样品,产量约为10,000片晶圆,采用尚未完全成熟的10nm级第六代(1c)DRAM技术 [5][6] - 三星采用激进定价策略,业内估计12层HBM4价格将比HBM3E高出60-70%,但三星正考虑低于20%的溢价,同时加速建设平泽第五工厂配备10纳米第六代DRAM生产线,专门用于批量生产HBM4 [6] HBF(高带宽闪存)技术前景 - HBF是将NAND闪存层叠而成的产品,利用NAND闪存特性实现更大存储容量,试图在带宽与容量之间找到新平衡点,满足AI基础设施对存储需求的指数级增长 [8] - 美国闪存企业Sandisk今年2月宣布正在开发HBF技术,将其定位为“结合3D NAND容量和HBM带宽”的创新产品,能够同时满足带宽、容量、低功耗的综合要求 [8] - HBF技术路线的提出源于AI模型向多模态、长上下文方向发展,需要处理海量中间状态数据,传统DRAM容量扩展成本高,NAND闪存访问速度慢,HBF试图通过架构创新找到最优解 [8] - Sandisk与SK海力士签订开发HBF的谅解备忘录,计划明年下半年向客户提供样本,2027年初为推理AI提供正式产品,此消息推动Sandisk股价从43美元飙升至86美元,翻了一番 [9] - HBF技术实现面临挑战,NAND闪存访问速度远低于DRAM,若CPU将基于NAND的存储当作主存使用,运算速度必然大幅下降,需要能够一次性处理和传输大规模信息的软件和基础设施支持 [9][10] - HBF和HBM并非竞争关系而是互补,HBF更适合需要超大容量的特定应用场景,如视频生成模型Sora需要处理数TB中间数据,HBF通过牺牲部分带宽换取更大容量满足这类需求 [10] - HBF在成本控制方面具有潜在优势,NAND闪存每GB成本远低于DRAM,在需要大容量但对带宽要求相对宽松的应用场景中具有明显经济性 [11] GDDR7技术应用与市场 - 英伟达推出Rubin CPX GPU采用128GB GDDR7显存而非更高端HBM4,体现对AI推理架构的新思考,提出“解耦推理”理念将推理过程拆分为上下文阶段和生成阶段 [13] - 在该架构下,Rubin CPX承担上下文构建任务,GDDR7带宽和延迟已完全足够,生成阶段工作交由配备HBM4的标准Rubin GPU执行,避免资源浪费并优化成本 [13] - HBM在加速器BOM中已成为最昂贵单一组件,从Hopper到Blackwell成本占比不断攀升,合理配置不同类型存储成为优化成本的关键 [13] - 英伟达为RTX Pro 6000下达大量GDDR7订单主要由三星承接,近期要求三星将GDDR7产量翻倍,三星扩大生产设施并增加材料与组件,预计本月启动扩产后的供应链 [14] - 英伟达准备推出代号“B40”新产品搭载三星GDDR7针对中国市场销售,通过降低数据处理能力规避出口限制,预计今年出货量可能达到100万片,仅GDDR7基板需求就高达约2000亿韩元 [14] - GDDR7的采用是成本优化选择,可能成为AI推理普及化的重要推手,通过大幅降低显存在系统总成本中的比重,使更多企业能够负担AI推理基础设施 [15] - 当token成本显著下降,用户对推理需求会激增,需求增长往往远远抵消成本下降影响,推动整个市场规模持续扩大,整体市场对高端HBM需求可能因应用普及而进一步增长 [15] 行业活动信息 - 2025年湾区半导体产业生态博览会(湾芯展)将于10月15—17日在深圳会展中心举办,展会规模扩容50%,展示面积突破60,000平方米,汇聚600+全球头部企业,预计吸引60,000名专业观众 [17] - 湾芯展将重点展示HBM、HBF、GDDR7等前沿存储技术及其在AI算力中心、智能汽车、超算平台中的应用突破,国内外存储巨头与创新企业将带来最新产品与解决方案 [18] - 展会首创“项目采购展”模式和全年服务体系,贯穿展前精准匹配、展中高效对接、展后持续跟进,推动百亿级产业合作落地,助力中国半导体实现从“跟跑”到“领跑”的跨越 [18]
9.30犀牛财经晚报:香港隔夜利率今年首次突破5%大关 世界首台“摄像”磁共振获批上市
犀牛财经· 2025-09-30 18:57
股票型ETF资金流向 - 股票型ETF连续两日净流入额超100亿元,9月26日和9月29日净流入额分别为193.93亿元和122.69亿元 [1] - 宽基ETF连续两日包揽净流入额前三,在周一资金净流入前十的ETF中占9席 [1] - 电池板块是周一唯一进入净流入前十的行业主题ETF,而券商板块在拉升背景下遭遇资金获利了结,多只券商ETF净流出额居前 [1] - 月内以来,券商、机器人、电池是资金净流入最多的三大板块 [1] 香港金融市场 - 香港隔夜银行同业拆息周二大幅上涨130个基点至5.018%,为去年12月以来最高水平,也是今年首次突破5% [1] - 截至9月的三个月内,香港隔夜Hibor累计上涨近500个基点 [1] 光伏产业链 - 部分硅片企业国庆节后才公布10月排产计划,在激进预期下减产幅度可能很小,后续需观察原料价格及下游传导情况 [1] - 整体第四季度根据协会配额,硅片企业基本确定将减产 [1] - 临近月末,部分外销电池厂为严控库存主动加强出货,推动整体电池片库存水平降至3-4GW [1] 存储芯片市场 - 9月NAND Flash市场综合价格指数单月上涨4.7%,涨幅反超DRAM的2.6% [2] - 2025年第三季度NAND Flash价格指数上涨5%,DRAM价格指数上涨19.2% [2] - 预计第四季度eSSD价格涨幅将达10%,DDR5 RDIMM涨幅约10%至15% [2] - 大型云服务商加速导入高容量QLC eSSD,导致部分QLC NAND供应出现紧缺 [2] - 预计2025年全球存储市场规模将达1932亿美元,创历史最高纪录 [2] - AI服务器等应用需求旺盛,原厂供应增长有限,导致NAND和DRAM出现结构性供应短缺,有望全面推升第四季度存储价格 [2] 民航运输与旅游 - 国庆中秋假期民航旅客运输量预计达1920万人次,或将创历史同期新高 [3] - 首都机场双节预计保障旅客167万人次,北京两机场假期预计运送旅客超297万人次 [3] - 海口、三亚日均机票预订量同比增幅均超20% [3] 燃料电池汽车产业 - 截至9月底,我国燃料电池汽车示范规模突破2万辆 [3] - 自2021年示范启动以来,五大城市群累计推广燃料电池车超2万辆,建设加氢站200座 [3] - 车辆纯氢运行里程超7亿公里,用氢行驶里程占比超90%,累计加注氢气超4万吨,减少二氧化碳排放超3.8万吨 [3] - 燃料电池汽车已在干线物流、冷链物流、公交客运等8大应用场景实现常态化运营,形成全球最大规模燃料电池商用车示范应用工程 [3] 医疗设备与机器人技术 - 联影医疗自主研发的世界首台"摄像"磁共振uMR Ultra获中国NMPA、美国FDA及欧洲CE认证,实现全球上市,公司成为全球唯一具备该技术的企业 [4] - uMR Ultra可持续捕捉高清动态影像,对运动部位观察诊断潜力重大,相关神经临床研究项目已在复旦大学附属华山医院启动 [4] - 宇树科技机器人被曝存在通过BLE连接Wi-Fi的关键安全漏洞,攻击者可实现最高权限控制,公司声明已注意到问题并完成大部分修复工作,将在不久后推送更新 [4] 人形机器人产业 - 特斯拉计划2025年底推出第三代人形机器人,并计划于2026年开始量产 [5] - 马斯克预计到2030年前公司将实现年产100万台机器人的目标 [5] 企业运营与资本市场动态 - 日本朝日集团遭网络攻击,导致其在日本的订单与发货业务及客户服务业务暂停,欧洲业务未受影响,目前尚未确认客户数据泄露 [6] - 鹏华基金发布公告澄清,有不法分子冒用公司名义引导投资者下载"鹏华工信APP"进行退费服务,声明该APP与公司无关,属非法行为 [7] - 中国国信服务控股有限公司向港交所提交上市申请书 [8] - 温氏股份获证监会批复同意向专业投资者公开发行不超过50亿元公司债券,批复有效期24个月 [8] - 上海建工子公司以1.9亿元竞得天津滨海新区一地块国有建设用地使用权 [9] - 百奥泰核心技术人员YU JIN-CHEN因个人原因离职,不再担任公司任何职务 [9] - 迅游科技股东陈俊所持203.13万股(占总股本1.00%)将被司法拍卖,若完成其持股比例将从6.44%降至5.44% [9] - 亚世光电及公司董事长兼总裁、财务总监因2024年年报存在收入提前确认、存货跌价准备计提不充分等问题收到辽宁证监局警示函 [9] - 塞力医疗股东上海盎泽私募基金计划减持不超过420.28万股,占公司总股本的2% [10] - 安徽建工及子公司中标"郎溪县2025-2027年'千万工程'农村环境综合提升项目",中标价6.06亿元,工期750天 [10] - *ST苏吴股票收盘价连续一日低于1元,若连续20个交易日低于1元可能被终止上市 [10] - 华新环保拟以4000万元至8000万元资金回购股份,回购价格不超过17.24元/股,用于股权激励或员工持股计划 [11] A股市场表现 - A股9月三大指数月线均收涨,创业板指本月累计涨超12%创三年多新高,科创50指数涨超11%创近四年新高 [12] - 本月市场热点集中在芯片产业链、机器人、储能方向,德明利本月股价翻倍,中芯国际等多只芯片股创新高 [12] - 机器人股中首开股份本月走出12天11板,储能方向宁德时代、阳光电源续创历史新高,宁德时代A+H股总市值在月中超越贵州茅台 [12] - 9月收官日沪深两市成交额2.18万亿元,较上一交易日放量200亿元,有色金属、存储芯片板块涨幅居前 [12]
天风证券:AI存储革命已至,“以存代算”开启存储新纪元
新浪财经· 2025-09-27 18:00
技术范式背景 - AI推理已成为衡量大模型商业化价值的关键标尺 但面临"推不动、推得慢、推得贵"的挑战 [1] - 为突破算力瓶颈与"存储墙"制约 "以存代算"作为颠覆性技术范式应运而生 [1] - 该技术通过将AI推理过程中的矢量数据从昂贵DRAM和HBM显存迁移至大容量高性价比SSD介质 [1] 核心技术价值 - CachedAttention技术将首Token时延显著缩短87% [2] - Prefill阶段吞吐量提升7.8倍 [2] - 端到端推理成本降低70% [2] - 实现存储层从内存向SSD的战略扩展而非简单替代 [1] 硬件架构突破 - SSD深度参与AI推理 需承接从HBM、DRAM卸载的KVCache [4] - AISSD技术向QLC颗粒演进 实现高性能与大容量兼顾 [4] - 接口协议以PCIe5.0/6.0搭配NVMe为基础 未来融入CXL技术 [4] - 功能向智能化升级 包括自主处理AI检索任务和液冷散热方案 [4] 企业实践案例 - 华为UCM构建智能分级缓存 数据在HBM、DRAM、SSD中按需流动 [5] - 浪潮存储AS3000G7优化存储架构与缓存管理机制 具备高扩展性 [6] - 焱融YRCloudFileKVCache实现分布式环境下高效存取与智能负载均衡 [8] - 铠侠、美光、Solidigm等国际巨头积极推动AISSD技术迭代与产品创新 [10] 产业发展方向 - QLC+PCIe/NVMe+CXL有望构筑下一代AISSD基座 [10] - SSD从单纯存储介质升级为AI推理"长期记忆"载体 [10] - "以存代算"催生核心机遇 带动SSD需求增速高于传统曲线 [10]
深信服:根据内部统计数据,公司EDS产品累计客户已超4000家
每日经济新闻· 2025-09-18 17:27
公司业务发展 - 公司于2019年正式发布企业级分布式存储产品EDS [2] - EDS产品累计客户已超4000家 [2] - 2025年上半年EDS产品收入实现较快增长 [2] 市场竞争地位 - 2025年第一季度公司EDS产品在"中国软件定义存储-文件存储"市场占有率排名第五 [2] 产品战略方向 - EDS产品聚焦高价值场景并持续推进产品品质提升和方案优化 [2] - 未来重点聚焦高性能统一存储方向 [2] - 持续推动EDS产品应用于大数据、AI推理等高价值业务场景 [2]
华尔街到陆家嘴精选丨SK海力士:HBM4已准备好首次量产!特斯拉股价缘何能两日累涨近14%?高盛上调金价预期 持续看好黄金股潜力
第一财经· 2025-09-15 09:47
SK海力士HBM4量产与市场影响 - 公司成功开发面向AI的超高性能存储器HBM4并构建全球首个量产体系 带宽为上一代两倍且能效提升超40% 采用2048个输入输出端口[1] - HBM4预计使AI服务性能提升69%并降低数据中心电力成本 公司计划今年下半年完成12层HBM4量产准备 芯片样品已于3月交付客户[1] - 作为英伟达关键供应商 公司今年上半年DRAM市场份额达36%超过三星的33% 若通过英伟达最终测试 HBM4将被AI芯片Rubin采用[1] - 高端HBM市场由三星 美光 海力士三大巨头主导 竞争激烈 三星计划2025年第四季度开始HBM4初期生产 美光的HBM4样品已进入客户验证阶段[1] - Meritz Security预测公司HBM市场份额到2026年将保持在60%左右[1] 特斯拉股价表现与业务进展 - 公司股价两日累计上涨超13.8% 创近三个月最大日涨幅 核心利好包括内华达州批准Robotaxi测试 需完成运营自我认证方可正式运营[2] - 其他推动因素包括上周推出的储能新品Megapack 3和Megablock Model Y L在中国热销且10月已售罄 以及马斯克潜在价值万亿的薪酬包确保其留任十年[2] 高盛黄金价格预测与行业观点 - 高盛将长期黄金价格预测从每盎司2850美元上调至3300美元 并表示到2026年中有望升至4000美元/盎司 极端情况下可能逼近5000美元[4] - 中型和大型黄金矿业公司如Capricorn Metals Ltd Westgold Resources Ltd Blue Gold Pentair PLC等股价有望跑赢黄金商品价格[4] - 黄金矿产企业的利润率扩张是关键驱动因素 预计这一趋势将持续 使黄金股在2025年底前继续跑赢大宗商品市场[4] 行业分析与投资机会 - HBM4精准匹配算力升级需求 带宽优势与生态适配性有助突破竞争格局 但需关注量产滞后 良率与成本压力[2] - 无人驾驶与机器人是特斯拉两大重点方向 需重视相关产业链机会[3] - 黄金定价进入多维驱动新阶段 美联储激进降息预期与美元信用弱化构成货币层面支撑 地缘风险常态化形成机制化溢价[4] - 存储芯片板块短期关注价格上升趋势 中期受益于AI需求驱动 长期看好自主可控与份额提升[2]
聊一聊Memory--被低估的万亿赛道
傅里叶的猫· 2025-09-14 21:42
文章核心观点 - 存储芯片市场在2024年达到1670亿美元历史新高 其中DRAM市场规模973亿美元 NAND Flash市场规模696亿美元 [4] - AI端侧设备如AI手机和AI电脑推动存储需求向高容量 高带宽 低功耗方向发展 LPDDR5或LPDDR5X成为主流选择 [9] - 存储芯片价格自2023年底触底回升 2025年上半年预计整体涨幅至少3%-5% 2025年下半年DRAM和NAND Flash因供应短缺持续涨价 [12][14] - HBM作为AI关键存储需求强劲 营收预计从2024年170亿美元翻倍至2025年340亿美元 HBM3E占2025年总需求64% [14][15] - 3D堆叠技术通过立体层叠实现更大容量和更快传输 成为满足AI存储需求的关键技术 国内企业如紫光国微 长鑫存储 长江存储已布局研发 [19] - 存储芯片产业链利润水平差异大 设计环节利润最高 封测和模组环节利润最低 下游需求中服务器和汽车领域加单较多 手机和PC需求疲软 [23] - 美光冻结报价并计划涨价20%-30% 海力士和三星分别涨价12%和22% 主要因AI需求导致产能紧张 [25] 存储芯片概述 - 存储芯片分为易失性存储和非易失性存储两大类 易失性存储断电后数据消失 如内存条 非易失性存储能保留数据 如U盘或固态硬盘 [5] - 易失性存储包括SRAM DRAM和HBM SRAM速度快但成本高 用于CPU缓存 DRAM速度较快容量大 用于智能手机 PC 服务器和AI计算 HBM通过3D堆叠实现高速度和带宽 用于AI加速器如GPU [6][7] - 非易失性存储以NAND Flash和NOR Flash为主 NAND Flash容量大成本低但写入速度较慢 用于SD卡 固态硬盘等 NOR Flash随机读取速度快 用于物联网设备 汽车CPU等 [8] AI端侧设备存储需求 - AI设备需要支持复杂数据模型运行 存储要求高容量 高带宽 低功耗 运行参数超过60-70亿的模型需DRAM内存容量至少14-15GB [9] - 存储带宽和速度不足会导致模型加载时间延长 影响用户体验 功耗控制关键因CPU在AI计算中耗电多 存储功耗高会提升整体能耗 [9][11] - AI设备中存储成本占比可能达硬件成本10%-20% 高于传统设备 [9] 存储芯片性能参数 - 带宽决定数据传输速度 高性能存储可达1TB/秒 低带宽成为AI训练和推理瓶颈 [10] - 延时指数据处理响应时间 低延时对实时场景如汽车自动驾驶重要 [11] - 容量不足会导致大模型无法运行 低端服务器至少需要128GB单条存储 [11] - 功耗需适应5V-6V低压 尤其对车载或移动设备关键 [11] - 寿命即擦写次数 超过后设备失效 对长期运行AI设备重要 [11] 存储芯片市场动态 - 2021年需求旺盛价格大涨 2023-2024年进入库存消化期价格低迷 2023年底价格触底回升 [12] - 2025年上半年整体涨幅至少3%-5% 2025年下半年DRAM交易放缓但DDR4价格反弹 NAND Flash价格Q3上涨 供应短缺可能持续到2026 [12][14] - 国内厂商长鑫存储和长江存储份额较小 全球市场由三星 海力士和美光主导 [10] 3D堆叠技术 - 3D堆叠通过立体层叠在有限空间实现更大容量 更快传输和更低功耗 分封装级和晶圆级 封装级已规模应用如HBM 晶圆级还在研发 [19] - 技术突破需改进材料 包括硅晶圆 靶材 光刻胶和电子特气 要求更高平整度 纯度 均匀成分和分辨率 [19] 存储芯片产业链 - 上游包括材料与设备 如ASML的光刻机 日本信越化学和SUMCO的硅片 国内沪硅产业 江化微 安集科技 [20] - 中游设计负责电路和性能定义 如兆易创新和北京君正 [20] - 中游封测与模组包括通富微电 长电科技 江波龙 朗科科技 [21] - 设计环节利润最高 技术门槛高溢价空间大 流片环节次之 封测和模组利润最低 [23] - 下游需求中服务器因AI数据中心扩张加单较多 汽车因智能驾驶需更多存储 手机和PC需求疲软增量有限 [23] 最新涨价情况 - 美光冻结报价并计划涨价20%-30% 汽车类涨价70% 闪迪涨10% 海力士5月涨12% 三星4月DDR4涨22% [25] - 涨价主要因AI需求导致产能紧张 包括代工厂挤占 [25]
AI存储需求激增 德明利加码PCIe SSD存储控制芯片及模组项目产能布局
证券日报网· 2025-09-13 10:11
公司战略调整 - 公司拟对前次定增募投项目进行结构性优化调整 重点加大PCIe SSD存储控制芯片及模组项目的资金投入力度 投资总额由原4.99亿元上调至7.43亿元 同时新增深圳光明作为项目实施地点 [1] - 此举旨在精准对接AI服务器存储领域的爆发式需求 通过集中核心资源强化项目推进 确保公司在本轮人工智能产业机遇中构建充分的市场竞争优势 [1] - 公司已成功进入国内头部云厂商的核心供应商体系 其企业级存储模组产品已实现稳定批量出货 [1] 行业需求背景 - 人工智能算力需求持续呈激增态势 国内头部云服务厂商持续提升资本开支 例如2025年字节跳动预计将在此领域投入1500亿元至1600亿元 [1] - 预计至2035年人工智能产业将为我国GDP贡献超11万亿元 或将带动算力需求实现十倍乃至百倍级增长 [2] - AI存储技术的迭代升级直接推动市场容量加速扩张 多级缓存架构创新和任务专用分离式设计通过DRAM和SSD承担更多数据存储需求 实现AI训练和推理的更优体验和更低成本 [2] 技术产能布局 - 公司依托全栈自研技术能力 通过主控芯片+固件算法+场景适配的全链路定制能力提升存储性能与稳定性 [3] - 以深圳智能制造基地为基础 新增深圳光明区基地作为拓展升级载体 搭建自动化生产+数字化管控智能产线 实现柔性化生产 [3] - 结合强大测试能力与实验室支持 快速响应AI存储交付的高质量 定制化需求 [3] 市场发展前景 - 高性能DRAM和SSD正加速向定制化 专业化方向快速发展 [2] - 存储作为算力基础设施核心环节存在迫切产能升级需求 [2] - 公司有望进一步扩大技术领先性与市场覆盖 推动国产存储在高性能AI场景渗透率提升 助力算力基础建设与AI产业高质量发展 [3]
破壁者华为:AI训推困局有了新解法
第一财经· 2025-09-01 17:56
行业背景与挑战 - AI模型参数达千亿级且多模态数据量突破ZB级 传统存储体系面临性能与容量瓶颈 [1] - 训练671B参数大模型需3.5PB原始语料 相当于350万个1TB硬盘容量 [3] - 国内大模型首Token生成时间平均1000ms 为美国同类产品2倍 每秒Token生成数仅25 token/s 不足美国产品十分之一 [3] 华为AI SSD产品创新 性能突破 - OceanDisk EX系列实现IOPS翻3倍 时延降至微秒级 缓解HBM与DDR内存负荷压力 [5] - 搭配DiskBooster驱动软件 通过内存扩展技术将内存扩大20倍 单台一体机可处理模型参数从32B提升至235B [5] 容量升级 - OceanDisk LC系列提供61TB/122TB/245TB容量 245TB版本容量密度比HDD高10倍以上 [6] - 存储250PB自动驾驶数据时 空间占用从1160U降至172U(省85.2%) 功耗从83.3kW降至51.2kW(省38.6%) 数据预处理速度从2.1TB/s提升至13.8TB/s(效率提6.6倍) [6] 行业影响与机遇 - 推动存储行业从通用产品向"场景驱动"转型 解决"速度跟不上、容量不够用"窘境 [8] - 降低AI产业门槛 使中小企业能够承担AI基础设施成本 激活医疗AI影像诊断与制造AI质检等领域创新 [8] - 存储核心竞争力转向软件算法与协同能力 DiskBooster等技术可横向拓展至云计算与大数据领域形成技术复用 [9] - 推动AI产业从"算力单点突围"转向"存力+算力"协同 加速"算法-算力-存储"生态协同发展 [8][9]
AI存储赛道,华为再出招
第一财经资讯· 2025-08-27 19:29
产品发布 - 华为于8月27日推出AI SSD产品系列 包括OceanDisk EX/SP/LC 最高单盘容量达122/245TB 为业内最大容量 [1] - AI SSD是专为AI工作负载优化的高性能大容量固态硬盘 结合公司自研多项核心技术 有望成为国产SSD突破的关键一步 [1] 行业挑战 - AI应用普及导致数据语料库从纯文本走向多模态 数据规模指数级增长 推理文本从短序列走向多模态融合长序列 [1] - 内存墙和容量墙问题成为AI训推效率和体验的关键瓶颈 对IT基础设施性能和成本造成巨大挑战 [1] - 训练671B大模型需采集3.5PB数据 全球互联网语料总量从350PB(文本)暴涨至154ZB(多模态) 传统存储介质难以承载 [1] - 671B模型训练微调需要13.4TB内存 需168卡承载 无法在一体机运行 限制模型训练效率与灵活性 [1] - 模型推理阶段TTFT平均1000ms 是美国大模型的2倍 TPS平均25 token/s 仅为美国大模型的1/10 影响用户体验与业务效率 [2] 市场竞争格局 - 2025年第一季度全球前五大企业级SSD品牌厂商依次为三星 SK海力士 美光 铠侠和闪迪 [2] - 中国存储容量增长快 但此前主要采用机械硬盘HDD 先进存储技术相对滞后 [2] - 华为 曙光 浪潮及长江存储等厂商逐步走出国产厂商自己的发展路径 [2] 技术发展趋势 - AI场景下SSD具有省电 高效 低运营成本优势 推动渗透率快速提升 [2] - 2024年服务器存储方案中固态硬盘占比预计达9%-10% 2028年AI服务器的SSD需求占比将攀升至20% [2] - 未来国内市场将逐步用大容量QLC SSD替代HDD 推动存储产业从容量导向向性能与容量双优转型 [3] - 华为等技术突破与生态构建将加速AI存储产业成熟 [3] 基础设施现状 - 截至今年6月底 我国存力规模达1680EB 呈现区域梯次布局 单机架密度提升 闪存渗透率提高三大特征 [3] - 全国外置闪存占比超过28% 金融 制造 互联网三个行业渗透率超45% 存力建设迈向升级阶段 [3]
万亿AI存储鸿沟如何填平?
36氪· 2025-08-26 16:08
AI存储行业发展趋势 - AI存储正迎来爆发式增长窗口期,新一代分布式存储能够实现百微秒级延迟与TB级吞吐,支撑训练、推理与Multi-Agent协同等核心场景,逐步成为AI时代存储层的主流选择 [1] - 全球数据量以36%的年增长率持续扩张,预计到2030年将达到YB级规模,高效、安全地存储海量数据成为算力发挥效力的前提 [2] - 大模型发展重心从训练主导转向推理优化和Agent生态,对存储需求产生五大核心变化 [3][4] 存储需求演变 - 吞吐需求从传统互联网应用的MB/s级提升至训练阶段数十GB/s、推理阶段百GB/s级,Multi-Agent协作需要500GB/s~1TB/s级聚合带宽 [5] - 延迟要求从传统应用的10ms级提升至训练中亚毫秒级、推理<1ms级,Multi-Agent协作需保持<1ms存储响应 [5] - 并发复杂性达到极致,需要支持GB/s级强一致同步、高QPS+低延迟推理,以及TB/s级实时协作 [5] - 多模态数据统一管理需求增强,需同时支持对象存储、文件系统、块存储和KV数据库,并支持数据快照和版本链 [6] - 支持Agent记忆持久化,解决碎片化记忆存储带来的高延迟和复杂度问题 [8][9] 技术突破与创新 - 以存代算成为全球共识,通过存储KV Cache等中间结果替代重复计算,将显存压力从平方级降至线性级,大幅提升推理效率 [7] - 硬件进入"超摩尔时代",NVMe SSD容量年增50%+,RDMA网络延迟低至十微秒级,但传统存储软件栈开销仍在百微秒级别,形成明显"剪刀差" [10][11][13][14][16] - Universal Storage架构通过统一存储池、多协议访问、元数据与数据分离等技术,解决传统存储架构的效率瓶颈和扩展性缺陷 [23][26][27][28] 市场动态与投资机会 - 硅谷AI存储公司Vast Data正进行新一轮融资,估值高达300亿美元,较2023年12月的91亿美元估值实现3.3倍增长 [2] - 传统企业级存储市场存在大洗牌的颠覆性机会,推理、Agent、向量化等新兴需求将导致数据量爆发,引发存储层投入大幅增长 [32] - 新一代Universal Storage存储软件技术护城河深,全球范围内缺少开源软件可供借鉴,技术和工程门槛高,客户迁移成本高,营收质量和可持续性好 [33] 理想存储架构特征 - 统一存储池支持文件、对象、块、KV多种协议访问,消除数据孤岛和迁移开销,显著降低TCO [26] - 元数据与数据分离,由专用分布式元数据引擎管理,存储在持久内存或高速SSD中,实现毫秒级响应 [27] - 全用户态存储软件和RDMA技术实现零拷贝数据直接送入GPU显存,延迟降至数十微秒级,CPU开销极低 [28] 对标企业画像 - 需要强技术背景和长期自主研发存储系统软件的团队,具备企业关键业务场景的分布式块存储研发经验 [30] - 需从底层系统开始创新设计,结合新一代系统架构和硬件发展,研发统一分布式存储架构,支持传统接口和AI核心场景新型接口 [31] - 生态开放性和硬件中立性至关重要,需无缝对接国产算力芯片、硬件、训练框架、推理框架、Agent、云计算、数据库等 [31]