Workflow
「Virtual VRAM」虚拟显存扩展卡
icon
搜索文档
第四范式(06682.HK)发布「Virtual VRAM」虚拟显存扩展卡,GPU资源利用率实现突破
格隆汇· 2025-09-30 09:37
产品发布与核心功能 - 第四范式正式推出Virtual VRAM可插入式虚拟显存扩展卡 通过将物理内存转化为可动态调度的显存缓冲池 实现GPU算力资源的弹性扩展[1] - 该产品创新性地构建了显存与内存之间的高速数据通道 将内存虚拟为显存使用 突破显存容量限制[1] - 单张显卡在使用该扩展卡后 虚拟显存容量最高可扩展至256GB 以NVIDIA H20显卡为例 其原生显存为96GB 扩展后相当于10张NVIDIA RTX 4090或6张NVIDIA A100的物理显存容量[2] 市场需求与行业背景 - 在AI大模型迅速发展的背景下 GPU显存容量正成为制约模型训练与推理效率的关键瓶颈[1] - 传统GPU显存容量固定且扩展成本高昂 限制了AI模型规模的扩大与多任务并发能力 用户往往只能通过购置更高端显卡或多卡并行来缓解压力 导致投入成本急剧上升[1] - 随着AI模型数量与参数规模持续高速增长 显存容量已成为制约企业AI能力构建与成本控制的关键因素[3] 应用场景与产品优势 - 产品主要面向两大应用场景 一是在大模型单卡运行显存不足时通过调用内存资源继续完成任务 避免采购额外显卡 二是在轻负载场景中将多个模型部署于同一GPU 实现资源动态调度 解决资源闲置问题[2] - Virtual VRAM具备高度兼容性与部署便利性 支持物理机 Docker容器及Kubernetes等云原生环境 用户无需修改现有代码或重新编译即可实现即插即用 大幅降低部署复杂度和二次开发成本[2] - 该产品有望为企业提供更具性价比的算力扩展方案 帮助用户在保持高性能的同时进一步实现降本增效[3] 未来发展计划 - 公司计划与更多内存厂商展开合作 持续推动AI基础设施的优化与普及[3]