Workflow
存算协同
icon
搜索文档
存力中国行北京站释放信号:AI推理进入存算协同深水区
搜狐财经· 2025-11-11 20:38
AI推理时代的发展趋势与挑战 - AI产业已从模型研发阶段进入规模化应用阶段,推理应用呈现爆发式增长,推动Token调用量呈指数级攀升[3] - 金融风控、医疗辅助诊断、电商推荐、投研分析等场景的深度渗透标志着“Token经济”时代到来[3] - 推理阶段的性能、效率与成本控制成为决定技术落地价值的“最后一公里”[1] AI推理规模化落地的核心痛点 - 数据层面:多模态数据爆发式增长使存储面临PB到EB级容量压力,数据格式异构导致高质量数据集构建成本高昂[3] - 性能层面:KV Cache技术广泛应用对存储的高带宽、低时延提出严苛要求,传统架构难以满足存算协同需求[3] - 成本层面:HBM等高端存储介质价格昂贵,叠加推理负载的潮汐性特征,导致中小企业智能化转型门槛居高不下[3] - 存储系统带宽和IOPS不足导致GPU等昂贵算力资源长时间空闲,阻碍AI应用落地[3] 存储架构的技术创新与突破 - 存储架构正经历从“被动存储”到“智算协同”的根本性转变,核心路径在于构建以KV Cache为中心的推理记忆数据湖[4] - 华为UCM统一缓存管理技术通过HBM-DRAM-SSD三级缓存架构,将非活跃KV Cache从显存动态卸载至高性能SSD[4] - UCM技术实现首Token时延最高降低90%、系统吞吐率提升22倍、上下文窗口扩展10倍以上的突破性效果[4] - UCM已于2025年9月在魔擎社区开源,向全行业开放接口,降低中小企业获取先进推理加速能力的门槛[4] 产业生态协同与标准化发展 - 中国信息通信研究院联合华为、中国移动、浪潮等企业成立“先进存力AI推理工作组”,围绕技术研究、标准制定、方案落地与生态构建四大任务[5] - 芯片厂商的3D堆叠技术、存储厂商的架构创新、云服务商的平台优化形成良性互动,实现软硬件协同增效[5] - 移动云探索以太网协议栈替代RDMA方案,为存量资源复用提供可行路径[5] 中国存力产业发展现状 - 截至2025年6月,全国存力总规模达1680EB,先进存储占比提升至28%[5] - 国产分布式存储产品、AI存储系统多次斩获国际权威测试冠军,232层三维闪存芯片达到业界先进水平[5][6] - 闪存主控芯片实现商用突破,产业链自主可控能力持续增强[5][6] 先进存力的战略价值与未来展望 - 先进存力已从“数据容器”转变为AI智算体系中的“协同中枢”,成为破解AI推理性能、成本与效率瓶颈的关键[7] - 通过破解内存墙、容量墙与成本墙,先进存力推动智能化转型从大企业的“奢侈品”转变为中小企业的“必需品”[7] - AI价值不再仅由参数规模定义,而取决于在真实业务场景中实现“快、准、省”的能力[7]
存力中国行暨先进存力AI推理工作研讨会在京顺利召开
证券日报网· 2025-11-07 15:29
会议核心观点 - 会议核心观点为AI规模化应用推进过程中,推理环节的成本、效率、质量问题凸显,先进存力成为提升AI推理效能、控制成本的关键支撑 [1][2] - 国家政策层面高度重视先进存力发展,在《算力基础设施高质量发展行动计划》等政策中明确方向,行业需凝聚共识共同推动存算协同发展 [2] 行业挑战与趋势 - AI推理面临KV Cache存储需求升级、多模态数据协同、存算协同带宽不足、负载潮汐性及成本控制等挑战 [3] - IT基础设施能力面临三大挑战:"管不好"的数据、"喂不饱"的算力、"降不下"的成本,传统存储架构难以满足高吞吐、低时延及异构数据融合需求 [4] - 未来存储技术趋势是从被动存储转向智算协同,分阶段落地高密全闪存储、数据高速互联、存算一体等技术,长远构建池化多体存储体系 [3] 公司技术方案与实践 - 中国移动云能力中心采用分层缓存调度、高速数据互联、多模数据专属存储、架构池化重组、高密全闪存储、数据缩减及自研SPU高密服务器等技术应对推理挑战并降低成本 [3] - 华为推出UCM推理记忆数据管理技术,通过集中高质数据、提速AI训练、优化推理效能三个角度打造AI推理加速解决方案 [4] - 北京硅基流动科技有限公司构建AI infra工具链,核心推理框架适配100多款开源大模型,结合UCM技术卸载KVCache释放显存,并通过智能网关优化流量调度与弹性扩缩容 [4] 行业生态建设 - 中国信息通信研究院联合产业链企业成立"算力产业发展方阵先进存力AI推理工作组",工作组成员包括中国移动云能力中心、华为、硅基流动、浪潮信息等公司 [2][5] - 会议提出三点产业发展建议:鼓励前沿存储技术研发创新,推动存算运深度融合,加强存算协同产业生态建设 [2]
存力中国行北京站暨先进存力AI推理工作研讨会顺利召开
观察者网· 2025-11-06 12:14
AI大模型推理面临的挑战 - AI大模型快速普及进入Token经济时代,中国日均Token消耗量已突破30万亿,头部企业日均消耗达百亿级[1] - 传统推理架构因数据重复计算和长序列输入等问题导致GPU利用率降低,造成推理成本持续攀升和用户体验下降[1] - 推理环节面临KV Cache存储需求升级、多模态数据协同、存算协同带宽不足、负载潮汐性及成本控制等挑战[4] - IT基础设施面临三大挑战:"管不好"的数据导致难以形成高质量数据集,"喂不饱"的算力因存储带宽和IOPS不足造成GPU空闲,"降不下"的成本阻碍AI应用落地[4][5] 先进存储技术的解决方案 - 中国信通院提出三点建议:鼓励前沿存储技术研发创新,推动存算运深度融合,加强存算协同产业生态建设[3] - 移动云采用分层缓存调度、高速数据互联技术提升带宽,通过高密全闪存储、数据缩减和自研SPU高密服务器提高存储效能并降低成本[4] - 华为研发UCM推理记忆数据管理技术,通过集中高质数据、提速AI训练、优化推理效能三个角度打造AI推理加速解决方案[5] - 硅基流动的AI infra工具链结合UCM技术卸载KVCache释放显存,通过智能网关优化流量调度和弹性扩缩容策略,提升系统吞吐[5] 行业发展趋势与政策支持 - 国家在《算力基础设施高质量发展行动计划》等政策中明确要求加速存力技术研发应用、持续提升存储产业能力、推动存算网协同发展[3] - 移动云推动存储从被动存储转向智算协同,分阶段落地高密全闪存储、数据高速互联、存算一体等技术,长远构建池化多体存储体系[4] - 中国信通院联合产业链企业成立"算力产业发展方阵先进存力AI推理工作组",凝聚产业共识推动存算协同发展[3][6]
先进存力赋能AI大模型发展
中国新闻网· 2025-11-06 10:29
行业政策与规划 - 工信部等六部门在2023年10月印发《算力基础设施高质量发展行动计划》,明确提出加速存力技术研发应用、持续提升存储产业能力、推动存算网协同发展等方向 [1] - 中国信通院联合产业链企业成立“算力产业发展方阵先进存力AI推理工作组”,旨在推动存算运深度融合和加强存算协同产业生态建设 [1] AI推理面临的挑战 - AI推理在各行业大规模使用,但面临推理效率、存力等突出问题,存储对大模型训练与推理效果至关重要 [1] - AI规模化应用推进使得推理环节的成本、效率、质量问题凸显,先进存力成为提升AI推理效能和控制成本的关键 [1] - AI时代IT基础设施面临三大挑战:“管不好”的数据、“喂不饱”的算力、“降不下”的成本 [2] 公司技术解决方案 - 华为针对AI推理研发UCM推理记忆数据管理技术,通过集中高质数据、提速AI训练、优化推理效能三个角度打造AI推理加速解决方案 [2] - 北京硅基流动科技有限公司建议核心推理框架适配多模态模型与国内外算力,适配昇腾并优化DeepSeek模型以实现性价比提升 [2] - 中国移动云能力中心推动存储从被动存储转向智算协同,分阶段落地高密全闪存储、数据高速互联、存算一体等技术,长远构建池化多体存储体系 [2]
宏杉科技闪耀东博会!荣登“中国AI出海未来独角兽企业TOP100榜单”,开启全球化新篇章
搜狐财经· 2025-09-23 16:45
公司核心动态 - 宏杉科技在第22届中国—东盟博览会上荣登“中国AI出海未来独角兽企业TOP100榜单” [1][3][4] - 公司CEO杨柳受邀出席榜单发布及授牌仪式,并接受媒体采访 [1][7] - 公司在展会上重磅亮相新一代AI存储产品MS5520G3 [9][11] 公司产品与技术 - 新一代AI存储产品MS5520G3基于第五代Intel至强可扩展处理器,采用全闪存优化的硬件架构与算法 [9] - 产品具备高IOPS、低时延、大容量弹性扩展能力以及持续稳定的高带宽,以适配AI智算场景的数据需求 [9] - 公司通过存算协同创新,推出DeepSeek一体机、智算中心AI存储等面向AI智算场景的定制化解决方案 [6] 公司战略与市场 - 宏杉科技于2025年正式启动出海战略,致力于将成熟的存储产品与解决方案输出到全球市场 [7] - 公司基于不同区域的差异化需求推出定制化场景解决方案,并持续完善海外渠道与服务网络建设 [7] - 公司认为中国—东盟市场是AI出海的“黄金港湾”,东博会为其提供了深度链接与合作的平台 [3][7] 行业背景与展会情况 - 第22届中国—东盟博览会共有60个国家约3200家企业参展,展示中国同东盟国家合作成果 [1] - 本届博览会首次设立人工智能专馆,使其成为展现AI产业前沿趋势的重要阵地 [9] - AI催生的数据洪流正推动存储行业迎来性能跃迁与智能化重构 [9]
押注“国产英伟达”!东芯股份2.11亿元再投亏损GPU公司
新浪财经· 2025-09-04 05:12
公司股价与市场表现 - 东芯股份复牌后股价一度上涨超14% 收盘涨幅1.17%报119.38元/股 市值达528亿元[1] - 7月29日至8月28日期间股价累计涨幅达207.85% 显著高于上证综指、科创50等指数表现[3] 对外投资动态 - 拟向砺算科技增资约2.11亿元 此前2024年8月已投资2亿元[1] - 本次联合亨通集团等投资方共同投资上海砺算 总投资额约5亿元[1] - 2024年8月投资后持有上海砺算37.88%股权 当时标的投前估值约2亿元[2] - 本次增资中上海砺算投前估值已显著提升(具体倍数未披露)[2] 被投企业财务状况 - 上海砺算2024年及2025年1-7月未产生营收 净利润亏损额分别为2.1亿元和1.55亿元[1] - 截至2025年7月资产总额3434.28万元 负债超1.2亿元[1] - 核心业务高度集中于自主研发的7G100图形渲染GPU产品[2] 主营业务表现 - 2023年归母净利润亏损3.06亿元 2024年亏损1.67亿元[3] - 2025年上半年营业收入3.84亿元(具体单位未披露)[3] - 确认对上海砺算投资亏损5231.11万元 占上半年净亏损近半数[3] 技术产品进展 - 上海砺算7月发布首款GPU芯片"7G100"系列及Lisuan eXtreme系列显卡 性能对标国际主流产品[3] - 东芯股份以存储为核心向"存算联"一体化布局 Wi-Fi板块仍需培育期[3] 行业观点与战略意义 - 投资体现对GPU领域长期看好及产业链协同效应追求[1] - 半导体企业对新兴技术公司的投资呈现前瞻性布局与高风险并存的特性[2] - 存算协同需要"协议-架构-场景-组织-产能-资本"六维耦合体系支撑[3] - 国产GPU实现技术突破但仍需量产和市场验证时间[3]
押注“国产英伟达”!东芯股份2.11亿元再投亏损GPU公司,股价狂飙难掩主业连亏
华夏时报· 2025-09-03 20:24
公司股价表现 - 东芯股份复牌后股价一度上涨超14% 收盘涨幅1.17%报119.38元/股 市值528亿元 [2] - 受上海砺算发布首款GPU芯片影响 公司股价一个月内累计上涨207.85% [2][9] - 因股价异常波动 上交所实施重点监控并于8月29日停牌核查 9月3日复牌 [9] 对外投资情况 - 拟向上海砺算增资2.11亿元 认购新增注册资本80.99万元 持股比例将达35.87% [3] - 2024年8月曾投资2亿元获得37.88%股权 标的公司投前估值从2亿元升至35亿元 [6] - 投资方包括亨通集团 上海道禾管理的基金及其他投资主体 总投资额约5亿元 [3] 被投公司财务状况 - 上海砺算2024年及2025年1-7月均无营收 净利润亏损2.1亿元和1.55亿元 [4] - 截至2025年7月资产总额3434.28万元 负债总额1.21亿元 资产净额-8633万元 [4] - 核心业务高度依赖7G100系列GPU产品 存在单一产品集中依赖风险 [5] 主营业务表现 - 2023年及2024年归母净利润连续亏损 分别为-3.06亿元和-1.67亿元 [7] - 2025年上半年营业收入3.43亿元 同比增长28.81% 但归母净利润-1.11亿元 同比下滑21.78% [7] - 对上海砺算投资确认亏损5231.11万元 占上半年净亏损近50% [8] 战略布局考量 - 投资旨在推进"存 算 联"一体化战略布局 强化核心竞争力 [4] - 通过存算协同提升整体性能与效率 需技术架构兼容性及研发团队协作机制 [2] - 存储主业面临盈利压力 持续高水平研发投入导致管销费用上升 [8] 技术产品进展 - 上海砺算7月发布首款GPU芯片"7G100"系列 对标英伟达架构 [2][10] - 产品支持最多48个并行任务 具备NRSS动态优化渲染画质技术 [9] - 在国产GPU中实现重大突破 但量产和市场验证仍需时间 [10] 行业专家观点 - 半导体跨界投资需5-7年实现技术协同 需持续资金支持和战略定力 [9] - 存算协同需协议 架构 场景 组织 产能 资本六维耦合 [10] - 投资体现对GPU领域长期看好 但存在技术失败和市场竞争风险 [5]
押注“国产英伟达”!东芯股份2.11亿元再投亏损GPU公司 股价狂飙难掩主业连亏
华夏时报· 2025-09-03 20:20
公司股价与市场反应 - 东芯股份9月3日复牌后股价一度上涨超14% 收盘涨幅1.17%报119.38元/股 市值528亿元 [2] - 受上海砺算发布首款GPU芯片"7G100"系列产品影响 公司股价在7月29日至8月28日期间累计上涨207.85% [8] - 因股价异常波动 上交所8月多次重点监控 公司于8月29日停牌核查 [8] 对外投资情况 - 公司拟向上海砺算增资2.11亿元 认购新增注册资本80.99万元 增资后持股比例达35.87% [3] - 此次投资方合计投资金额约5亿元 上海砺算投前估值达35亿元 较2024年8月投资时2亿元估值大幅提升 [5] - 2024年8月公司曾以自有资金2亿元投资上海砺算 当时持股比例为37.88% [5] 被投企业财务状况 - 上海砺算2024年及2025年1-7月未产生营收 净利润分别亏损2.1亿元和1.55亿元 [3] - 截至2025年7月 公司资产总额3434.28万元 负债总额1.21亿元 资产净额-8633万元 [3] - 核心业务高度依赖7G100图形渲染GPU产品 存在对单一产品的集中依赖风险 [5] 公司主营业务表现 - 2025年上半年营业收入3.43亿元 同比增长28.81% 但归母净利润亏损1.11亿元 同比下滑21.78% [6] - 2023年和2024年归母净利润连续亏损 分别为-3.06亿元和-1.67亿元 [6] - 上半年对上海砺算投资确认亏损5231.11万元 占净亏损近一半 [7] 技术产品进展 - 上海砺算7月发布首款GPU芯片"7G100"系列 支持最多同时运行48个无依赖任务 支持NRSS动态优化渲染画质 [8] - 产品性能对标英伟达DLSS技术和AMD FSR技术 被市场称为"国产英伟达" [8] - 技术实现端、云、边的主流图形渲染和AI加速 对标主流GPU架构 [3] 战略布局与行业观点 - 投资旨在推进"存、算、联"一体化战略布局 强化核心竞争力 [3] - 存储芯片企业跨界GPU领域可通过"存算协同"提升整体性能与效率 但需技术架构兼容性和研发协同 [2] - 半导体跨界投资通常需要5-7年实现技术协同效应 需持续资金支持和战略定力 [9]
中国电信股价下跌1.17% 参与成立AI推理工作组
金融界· 2025-08-27 00:26
股价表现 - 2025年8月26日收盘价7.58元,较前一交易日下跌0.09元,跌幅1.17% [1] - 当日成交量155.98万手,成交金额11.82亿元 [1] 资金流向 - 8月26日主力资金净流出2.06亿元,占流通市值0.04% [1] - 近五个交易日主力资金累计净流入2004.96万元 [1] 业务定位 - 公司属于通信服务行业,是大型国有控股电信运营商 [1] - 主要提供固定及移动通信服务、互联网接入服务及信息服务等基础电信业务 [1] - 国内三大电信运营商之一,在通信基础设施建设、云计算、大数据等领域具有重要地位 [1] 技术进展 - 参与成立"先进存力AI推理工作组",推动AI推理领域"存算协同、生态共建"发展 [1] - 研发的"广域智算无损组网技术"在2025中国算力大会展示,可实现远距离数据中心高效协作 [1]
工信部:有序引导智能算力基础设施适度超前动态平衡
中国证券报· 2025-08-23 04:09
算力基础设施发展 - 工业和信息化部将持续优化全国算力布局 有序引导智能算力基础设施适度超前和动态平衡[1] - 建议加强算力 存力 运力协同发展 强化存储与计算 网络的融合设计 构建先进 安全 绿色 易用的存储体系[1] - 我国算力总规模位居全球第二 截至今年3月在用算力标准机架达1043万架 智能算力规模达748EFLOPS[1] 存力发展现状 - 2024年全国数据年产量达41.06ZB 但存储总量仅为2.09ZB 存在数据"应存未存"现象[1] - 数据生产量快速增长与存储资源扩充速度不匹配[1] - 建议构建存算协同新模式 助力数据要素价值深度释放 推动AI强国建设[1] 运力发展挑战 - 当前存在算力资源调度低效 GPU效能发挥不足等核心挑战[2] - 具身智能 大模型等新业务形态对网络端提出超低损伤 超低时延 高吞吐等新需求[2] - 需要通过策源技术创新实现算力网络的极致性能和极致效率[2] 山西算力产业发展 - 山西正抢抓"东数西算"战略机遇 以算力产业为核心引擎推动经济增长方式转变[2] - 打造京津冀外溢算力需求和算力产业的最佳承载地 构建"通算+智算+超算"多元协同的算力供给体系[2] - 全省在用算力中心机架规模达51.4万标准架 智算规模32EFLOPS 算力中心平均PUE仅1.2 多项指标全国前列[2]