核心观点 - 铠侠公司成功演示了在单台服务器上实现48亿高维向量搜索数据库 并利用GPU将索引构建时间加速了7.8倍 这标志着检索增强生成解决方案的重大进步[1] - 通过结合其AiSAQ SSD向量搜索技术与英伟达GPU加速索引构建 公司为大规模部署提供了实用的索引构建方案[2][5] 技术突破与性能 - 公司使用其开源KIOXIA AiSAQ近似最近邻搜索技术 在单台服务器上实现了对48亿个1024维向量的高维向量搜索扩展[1] - 通过利用英伟达cuVS库进行GPU加速 公司在AiSAQ索引构建时间上实现了高达20倍的改进 端到端构建时间实现了高达7.8倍的改进[3] - 具体而言 使用四颗英伟达Hopper GPU构建索引的时间从使用CPU时的284天缩短至14天 端到端测试时间从31天缩短至4天[3] - 该演示处理了总计19.66 TB的向量数据[9] 产品与解决方案 - AiSAQ技术通过直接从SSD进行向量搜索并减少DRAM使用 解决了RAG的可扩展性挑战[4] - 该技术采用创新的全局索引算法 结合混合聚类和图搜索 以在极端规模下实现高效的向量搜索[4] - AiSAQ软件提供灵活的调优选项以平衡性能和大规模向量可扩展性 使大规模部署更易于实现和扩展[4] - 该技术非常适合多租户环境和大规模单体索引部署[4] - 公司持续开发以支持超过48亿向量的更大规模部署[1] 并持续演进AiSAQ能力以支持万亿向量部署[5] 行业影响与应用 - 向量数据库为需要实时理解海量非结构化数据集的意图、上下文和相似性的应用程序提供骨干支持[4] - 随着AI应用可能依赖存储在SSD上的数百亿甚至更多向量化信息 仅使用DRAM在十亿规模下已不切实际[3] - 在由GPU加速索引构建提供支持的Milvus向量数据库环境中 公司通过AiSAQ技术实现了十亿级搜索 使用单查询服务器即可满足RAG应用延迟要求[3] - 公司致力于推进支持大规模智能数据处理的存储驱动型AI解决方案[5] 公司动态与背景 - 铠侠美国公司是铠侠株式会社的美国子公司 后者是全球领先的闪存和固态硬盘供应商[8] - 公司的创新3D闪存技术BiCS FLASH正在塑造包括高级智能手机、PC、汽车系统、数据中心和生成式AI系统在内的高密度应用存储未来[8] - 公司将在英伟达GTC 3522展位展示AiSAQ及其他技术创新[6] - AiSAQ开源软件可通过GitHub下载[6]
KIOXIA Achieves 4.8 Billion High-Dimensional Vector Search Database on a Single Server, with 7.8x Index Build Time Acceleration via GPUs