生成式AI+Agent
搜索文档
申万宏源:AI Infra已成为AI应用落地关键 “卖铲人” 看好OLTP与向量数据库方向
智通财经网· 2025-12-24 14:49
AI基础设施(AI Infra)成为AI应用落地的关键“卖铲人” - AI Infra作为AI模型训练与推理的底层支撑,已成为应用落地的关键“卖铲人”[1] - 生成式AI与Agent加速渗透,AI infra软件作为应用部署的基础设施,有望进入高速增长期[1] 算力调度是决定模型推理盈利能力的核心 - 算力调度是决定模型推理盈利水平的核心变量,国内模型Token收费显著低于海外,成本敏感度更高[1] - 阿里Aegaeon通过Token级调度可减少82% GPU用量,华为Flex:ai提升30%算力利用率,高效调度能力成为模型推理厂商盈利关键[1] - 根据测算,在单日10亿查询量下,若使用H800芯片,单卡吞吐能力每提升10%,毛利率能够提升2-7个百分点[1] 向量数据库与数据类Infra需求率先爆发 - 数据类Infra需求先于应用爆发,向量数据库成刚需[2] - RAG技术渗透率快速提升,Gartner预测2025年企业采用率将达68%[2] - 向量数据库作为RAG核心组件,支撑海量数据毫秒级检索,市场需求持续高增[2] AI时代数据架构向“实时运营+分析协同”演进 - AI时代数据架构从“分析优先”转向“实时运营+分析协同”[3] - 行业变化一:NoSQL与OLTP数据库再风靡,通过补充向量索引能力切入向量数据库市场[3] - 行业变化二:数据湖、数据仓库厂商(以OLAP为主)通过并购、合作方式引入AI模型,向全栈工具迈进[3] 数据库厂商的差异化竞争格局 - MongoDB凭借“低门槛+高弹性”,契合中小客户低成本AI落地需求,增长弹性突出[3] - MongoDB作为文档型NoSQL数据库,适配非结构化数据存储与高频实时CRUD操作,契合AI原生应用与Agent需求,2025年收购Voyage AI补齐向量检索能力[3] - MongoDB FY26Q3核心产品实现30%增速,增长弹性突出[3] - Snowflake与Databricks靠全流程工具链和客户粘性,占据数据密集型行业核心场景,但需应对CSP跨界竞争与实时能力短板[3] - Snowflake与Databricks以OLAP为核心向全栈工具延伸,靠海量数据处理能力成为中大型企业首选,但TP能力暂有不足(尤其是Snowflake),面临中小市场渗透与云厂商挤压压力[3] GPU主导数据中心,驱动存储与数据库技术升级 - GPU主导数据控制中心,存储与数据库技术升级[4] - NVIDIA推出SCADA方案实现GPU直连SSD,将IO延迟降至微秒级[4] - 向量数据库需适配GPU并行计算,通过列式存储、算子重写等技术升级,匹配AI实时推理需求[4] 相关上市公司标的 - 相关标的包括:MongoDB(MDB.US)、达梦数据(688692.SH)、英方软件(688435.SH)、Snowflake(SNOW.US)、深信服(300454.SZ)等[5]