Workflow
向量检索算法
icon
搜索文档
只改2行代码,RAG效率暴涨30%!多种任务适用,可扩展至百亿级数据规模应用
量子位· 2025-06-21 14:07
向量检索技术突破 - 浙江大学团队开源PSP方法,通过修改两行代码使RAG向量检索效率提升30%,适用于十亿级大规模应用[1] - 突破传统欧式距离检索局限,解决最大内积检索中语义相关性与数学结构不匹配的核心难题[2][3][4] 技术原理创新 - 发现欧式距离图结构经微小改动即可实现最大内积全局最优解,无需空间转换导致信息损失[8][11] - 提出贪心算法新范式:构建图用欧式距离,搜索时改用内积度量,保持拓扑结构同时精准定位语义相关结果[10][11] - 设计"由内而外"搜索路径优化策略,利用决策树实现自适应早停机制,减少35%冗余计算[16][19][20] 性能验证 - 在8个高维数据集测试中,PSP的QPS表现稳定领先,MNIST数据集检索速度达第二名4倍[21][23] - 支持1536-3072维向量,1亿级数据规模下仍保持log(N)级时间复杂度,具备百亿级扩展潜力[21][25][26] - 泛化性强,覆盖文搜文、图搜图、推荐系统召回等多模态场景,无数据集依赖性缺陷[1][25] 行业应用价值 - 向量检索为AI产品核心组件,PSP解决度量空间错配问题,直接提升语义搜索准确率[6][7] - 开源方案降低技术门槛,现有HNSW/NSG等系统仅需两行代码修改即可适配最大内积场景[11][13]