AI Storage
搜索文档
解读AI存算加速系统大机遇
2026-03-26 21:20
关键要点总结 一、 涉及的行业与公司 * **行业**:AI 算力基础设施,具体为 AI 存储/存算加速系统领域 [1] * **公司**:风行智远,一家致力于成为国产 AI 算力与加速应用领航者的公司,由国内头部智能存储公司部门分拆而来,成立于2023年底[2] 二、 市场机遇与行业瓶颈 * **市场机遇**:AI 存储已成为算力瓶颈,智算中心存储投资占比从 1% 提升至 10%-15%,中国市场复合年均增长率超过 40% [1][3] * **核心瓶颈**:存储系统成为性能短板。主流 NVMe SSD 单盘速度约 7 GB/s,理论上需要超过 1,000 个硬盘才能满足一张英伟达 B300 GPU (超过 10,000 GB/s) 的满速计算需求 [3] * **瓶颈根源**:传统架构下,CPU 负责管理和调度 SSD 数据,随着需求激增,CPU 调度瓶颈限制了向GPU传输数据的带宽 [3] * **新架构需求**:英伟达最新 Vera Rubin 架构提出“3.5 层存储”概念,旨在将数据直接从硬盘传输给显卡 [7] 三、 风行智远的核心技术与产品定位 * **公司定位**:国产 AI 算力与加速应用的领航者,通过颠覆性技术解决大模型时代的存储瓶颈 [2] * **技术定位**:介于海外 2.0 和 3.0 阶段之间的 2.5 代智能存储,兼具智能存储的计算能力和存储加速的核心能力 [1][5] * **核心产品形态**: 1. 具备 AI 算法加速功能的加速模组(类似硬盘)[12] 2. 由加速模组构成的、针对 GPU 优化的池化存储系统(类似英伟达架构中的 3.5 层)[12] 3. 支持企业级客户部署私有化大模型的一体机 [12][20] * **核心技术能力**: 1. **存算直通技术**:绕过 CPU 和文件系统,实现存储到计算的直通,将数据吞吐量提升 2-4 倍,节省 30%-40% 能耗 [1][4][11] 2. **边存边算技术**:硬盘在存储时对模型数据进行预处理,多块硬盘协同后直接交付给显卡,可节省约 11% 的训练总成本 [11] 3. **以存代算技术**:用智能硬盘(SSD)替代内存存储中间结果(如 KVCache),通过主动数据协处理弥补速度差距,将访存成本降至原方案的 1/50,综合业务成本降低 13% [1][11][14] 4. **存算一体化技术**:通过盘内算力替代主机 CPU 和 GPU 执行数据协处理,进行高效的算力卸载 [11] * **技术积累**:产品采用获得五项奖项的“一芯”DeepSSD 构建数据流架构,经测试算效比达到英伟达 T4 及 A100 平台的约 3.7 倍 [15] 四、 应用场景与价值体现 * **大模型训练**: * **价值**:优化故障恢复流程,支持故障后增量更新,无需频繁写入全量 Checkpoint,可节省约 11% 的训练总成本 [1][13] * **背景**:GPU 故障率较高(英伟达 GPU 故障周期不到两天),数据搬运耗时在优化后的智算中心占训练总时长的 15% 至 25% [7] * **大模型推理**: * **价值**:针对 DeepSeek 等 MoE 模型,可将推理总成本降低约 30% [1] * **具体案例 (DeepSeek 671B)**:将原先对 1TB 内存的需求,降低到每轮仅需获取约 71MB 乘以 8(硬盘数量)的数据量,访存成本降至原先的 1/50,对CPU的要求也从单颗成本超 5 万元降低到数千元级别 [14] * **预处理阶段**:通过智能存储加速系统,将传统流程中数据从原始存储到训练完成的六次搬运减少到三次,提升业务效率 [13] * **与 LPU 的关系**:风行智远的存算融合加速系统与英伟达的 LPU (Language Processing Unit) 在推理流水线中角色不同。LPU 负责解码过程,而该系统负责处理 LPU 无法容纳的中间数据,定位是服务好 LPU 和 GPU,处于英伟达架构中的存储 3.5 层 [16] 五、 市场竞争与生态合作 * **海外对标公司**: * **DDN**:英伟达御用存储系统公司,估值 50 亿美金,2024年收入超 10 亿美金 [6] * **VAST Data**:以色列公司,技术进入 3.0 阶段初期,估值已从 90 亿美金增长至 300 亿美金 [1][18] * **Pliops**:以色列公司,通过专用加速卡将 AI 训练和推理速度提升 8 至 21 倍,估值约 9.7 亿美金 [6] * **国内竞争格局**:公司表示目前没有直接竞争对手,已与国内技术和市场领先的大型人工智能系统公司进行联合联动和技术协同 [18] * **生态合作与客户**: * 已导入中国电信、中国移动和中国铁塔三大运营商 [1][15] * 已与国产GPU头部客户及多家上市GPU公司完成联动测试,并体现性能优势 [1][15][18] * 与浪潮、中国电子等国产云公司合作,推动存量数据中心的高效替换改造 [15] * **市场战略**:结合产业资源(国产GPU厂商、高技术企业、上市公司投资者),共同推动产品向一线互联网厂商导入,覆盖存量数据中心AI化改造和新建数据中心 [15][18] 六、 其他重要信息 * **团队背景**:核心团队来自国内头部智能存储公司,曾承担存算一体化国家专项。董事胡郁为科大讯飞联合创始人。CTO 曾担任 AMD 的 GPU 片上系统集成与系统验证负责人 [2] * **供应链与成本趋势**: * DRAM 和 HBM 持续涨价,若 HBM 价格再翻一倍,部分 AI 芯片公司考虑采用 SRAM 工艺自主设计芯片替代 [17] * 英伟达与合作伙伴开发更快的 AI SSD,目标绕过内存条和 CPU,直接从智能硬盘集群提取数据,预计可降低整体综合功耗 30% 至 40%,节省存储系统投资成本 40% 至 50% 以上 [17] * **产品交付与价值主张**: * 交付的是产品及配套方案。改造现有数据中心时,主要替换国外硬盘并加载软件,不改变物理接口 [20] * 为新建数据中心带来至少 2 至 4 倍的业务加速,并节省对内存和 CPU 的资源需求 [20] * **市场潜力**:若英伟达的“3.5层存储”架构普及,到 2027 至 2028 年,仅英伟达一家的存储采购规模就将占到全球闪存市场的 9.3% [7][17]
AI存储解决方案巨头冲击IPO,估值45.8亿,腾讯押注,来自北京
格隆汇APP· 2026-01-29 18:08
公司概况与上市信息 - 公司是来自北京的AI存储解决方案巨头,正在冲击IPO [1] - 公司IPO估值达到45.8亿美元 [1] - 腾讯是公司的投资方之一 [1] 业务与市场定位 - 公司专注于AI存储解决方案领域 [1] - 公司在行业内被定位为“巨头” [1]
星辰天合冲击IPO,专注于AI存储解决方案领域,连续两年亏损
格隆汇· 2026-01-29 18:00
全球存储芯片市场动态 - 近期全球存储芯片市场关注焦点为价格上涨,三星电子已在2026年第一季度将NAND闪存供应价格上调100%以上,SK海力士等公司同步跟进 [1] - 存储芯片公司股价表现强势,包括三星、海力士、希捷科技、西部数据、闪迪、美光科技等 [1] - 国内存储芯片企业迎来利好,多家公司披露2025年度业绩预告,其中澜起科技2025年净利润同比预增52%至66%,德明利2025年4季度净利润预计环比增长645%至810% [1] 星辰天合公司概况 - 北京星辰天合科技股份有限公司于1月27日向港交所递交上市申请,寻求根据第18C章规则在主板上市,由华泰国际担任保荐人 [2] - 公司曾考虑A股科创板上市,但为拓展全球业务并利用联交所国际平台,主动决定寻求香港上市 [2] - 公司成立于2015年5月,由执行董事胥昕及王豪迈创办,总部位于北京 [3] - 截至2026年1月20日,胥昕、王豪迈及星辰天枢作为一组股东,共同控制公司已发行股份总数约25.72%的表决权 [3] - 公司成立以来完成8轮融资,投资人包括博裕投资、启明创投、腾讯、中金甲子、君联资本等知名机构 [3] - 2022年12月融资后,公司投后估值约45.8亿元人民币 [4] 公司管理层 - 胥昕,35岁,任执行董事、董事长、总经理兼首席执行官,负责集团战略、技术创新及运营体系整体规划 [5] - 王豪迈,33岁,任执行董事、副总经理兼首席技术官,负责技术研发、产品架构决策及核心技术创新 [5] - 张旭明,43岁,任执行董事、副总经理兼首席运营官,负责管理业务拓展与销售运营 [5] - 方菲,34岁,任执行董事、总法律顾问兼高级副总裁,负责法律事务、合规管理及人力资源 [5] 业务与产品 - 公司专注于提供企业级AI存储解决方案,助力企业大规模高效整合数据、决策及运营 [6] - 主要提供两类解决方案:AI数据湖存储解决方案与AI训推存储解决方案,同时提供AI存储服务 [6] - AI数据湖存储解决方案于2022年7月上市,2022年9月开始产生收入,旨在整合、清洗和保存海量原始非结构化数据至集中式存储库 [7] - AI训推存储解决方案于2021年7月上市,2021年9月开始产生收入,旨在高速向高性能计算资源提供数据,支持模型训练和推理 [8] - 解决方案以一体机和纯软件两种形式交付,软件产品包括XEOS、XEDP、EasyData、XEBS/XEBS-XINFINI及XGFS [9] 财务表现 - 2023年、2024年及2025年1-9月,公司收入分别为1.67亿元、1.72亿元、1.95亿元人民币 [11] - 同期净利润分别为-1.81亿元、-8418万元、811万元人民币,在2025年前九个月实现扭亏为盈 [11] - 报告期内毛利率分别为55.4%、63.7%、63.7% [11] - 按业务划分,2023年至2025年1-9月,AI数据湖存储解决方案收入占比由37.2%提升至46.1%,AI训推存储解决方案收入占比由45.4%下降至39.7% [13] - 截至2025年9月30日,使用公司AI存储解决方案的企业数量超过420家 [13] 研发与运营 - 公司研发专注于软件定义、协议无关的数据平台,可扩展至上千亿个对象乃至EB级存储池,所有特专科技产品及核心技术均为内部自主研发 [15] - 截至2025年9月底,研发团队由125名成员组成,占员工总数的40.8% [16] - 报告期内研发费用分别为1.1亿元、8796万元、5746万元人民币,占各自期间总收入的比例分别为65.9%、51.0%、29.5%,占比呈下降趋势 [16] - 业务倚重第三方服务商采购硬件组件,如固态硬盘、内存及网络接口卡,报告期内向前五大供应商的采购额占比分别为45.2%、56.1%及67.9%,集中度较高 [16][17] - 客户包括经销商及直销客户,报告期内来自直销客户的销售额占比分别为41.1%、40.3%及28.7%,客户涉及智能制造、金融机构、电信运营商及科技企业等领域 [18] - 报告期内全部收入均来自中国(包括香港) [18] 现金流与资金状况 - 报告期内,公司经营活动现金流出净额分别为1.53亿元、3927万元、4035万元人民币 [19] - 截至2025年11月30日,公司持有现金及现金等价物2790万元人民币,外加定期存款及已承诺未动用银行融资,合计约1.81亿元人民币 [19] 行业前景与竞争格局 - 新一波AI发展浪潮推动了对AI基础设施(计算、存储和网络)的需求显著增加,预计未来将保持增长趋势 [23] - AI存储专为AI任务设计优化,旨在满足超大容量数据保存和高性能数据读写的要求 [25] - 根据灼识咨询资料,中国本地部署AI存储装机量在2024年达到13.4EB,预计2030年扩大至67.2EB,复合年增长率为30.9% [25] - 中国本地部署AI存储市场规模在2024年达到141亿元人民币,预计2030年增长至719亿元人民币,复合年增长率为31.1% [25] - AI存储产业链中,星辰天合位于中游的解决方案提供商环节,是产业链的价值核心 [27][28] - 市场竞争激烈,按2024年装机量计,中国前五大分布式AI存储解决方案提供商合计市占率为52.3% [31] - 星辰天合占市场的10.4%,是中国第二大的分布式AI存储解决方案提供商,及最大的独立分布式AI存储解决方案提供商 [31] - 主要竞争对手包括华为、浪潮信息、新华三、中科曙光等公司,公共云服务提供商也可能成为替代解决方案 [31]
【研报行业】液冷千亿市场蓄势待发,国产链加速入局,谁能抢占英伟达生态新红利?关注这些全链条布局厂商
第一财经· 2025-12-08 19:47
液冷行业 - 液冷市场为千亿级别市场 目前正蓄势待发 [1] - 国产产业链正在加速入局 关注能够抢占英伟达生态新红利的全链条布局厂商 [1] AI存储行业 - AI发展催生存储新周期 HBM市场规模预计在六年内翻五倍 [1] - 存储设备环节迎来确定性增长机遇 存在值得关注的核心标的 [1]
广发证券:推理驱动AI存储快速增长 建议关注产业链核心受益标的
智通财经网· 2025-09-23 16:56
AI推理存储需求增长 - AI推理应用快速增长推动对高性能内存和分层存储的依赖显著提升 HBM DRAM SSD及HDD在超长上下文和多模态推理场景中发挥关键作用[1] - 轻量化模型部署推动存储容量需求快速攀升 预计未来整体需求将激增至数百EB级别[1] - 2026年10个谷歌级推理应用所需存储容量测算为49EB 基于单月处理超980万亿tokens及FP16格式存储等关键假设[3] 分层存储架构特征 - AI服务器存储主要包括HBM DRAM SSD等 呈现性能逐级下降 容量逐级增加 成本逐级降低特征[1] - 访问频繁数据保留在较高存储层如CPU/GPU缓存 HBM和动态RAM 鲜少访问数据移动到较低存储层如SSD和硬盘驱动器[1] - HBM集成于GPU内部为权重和激活值提供高带宽临时缓冲 DRAM作为系统内存存储中间数据及实现CPU与GPU间高效数据传递[2] 各级存储功能协同 - 本地SSD用于实时加载模型参数和数据满足高频读写需求 并存储短期检查点与临时生成内容支撑快速迭代[2] - HDD提供经济大容量用于保存原始数据 历史检查点及生成内容保障系统长期运行与数据安全[2] - HBM与DRAM提供即时高性能支撑 SSD保证快速可用数据 HDD保障容量与可靠性 构建从高速临时访问到长期存储的完整生态[2] 技术升级推动效率提升 - 高带宽与大容量内存可降低访问延迟提升并行效率 月之暗面Mooncake通过存储资源重构实现计算效率跃迁[3] - AMD MI400升级为MRDIMM模组 华为UCM推理记忆数据管理器实现智能调度 共同支撑复杂模型在高性能推理场景的应用[3] - Vera Rubin CPX NVL144机柜新增GDDR7 进一步强化内存带宽和容量以应对超长序列和多模态数据处理需求[3]