Workflow
RAG和AI Agent
icon
搜索文档
打破瓶颈,让RAG学会思考:中科大、智源等发布推理检索框架BGE-Reasoner
36氪· 2025-08-27 21:04
技术突破 - BGE-Reasoner在BRIGHT基准测试中获得45.2分,以领先第二名3.6分的优势刷新历史最佳纪录 [1][5][7] - 该方案通过三阶段模块化框架(查询改写/向量检索/重排序)显著提升推理密集型检索性能 [2][6][16] - 内置向量模型BGE-Reasoner-Embed超越Seed1.5-Embedding、Qwen3-Embedding等基线模型 [5][9] 技术架构 - 采用Rewriter(基于Qwen2.5-7B微调)、Embedder(基于Qwen3-8B微调)、Reranker(基于Qwen3系列微调)的三模块端到端架构 [10][11][12] - 使用大模型合成覆盖数学/代码等多领域的高质量训练数据,解决数据稀缺问题 [6][10] - 在Reranker训练中引入强化学习,提升模型对困难样本的推理泛化能力 [6][12] 行业地位 - 超越蚂蚁集团与中山大学联合研发的DIVER(41.6分)、百度与人民大学等机构开发的ReasonRank(40.8分)等竞争对手 [5][7] - 由中科大、智源研究院、北邮、港理工等机构联合研发,是BGE系列模型的重要里程碑 [1][2] - 技术方案及训练数据将面向社区开源,推动领域研究发展 [2] 应用场景 - 专门针对需要多步逻辑推理、语义链整合和背景知识运用的复杂检索场景 [3][10] - 对RAG技术和AI Agent在深度研究等复杂推理任务中的发展具有决定性意义 [1][3] - BRIGHT基准包含StackExchange、LeetCode、数学竞赛等领域的真实查询数据 [3]