Workflow
推理密集型信息检索
icon
搜索文档
打破瓶颈,让RAG学会思考:中科大、智源等发布推理检索框架BGE-Reasoner
36氪· 2025-08-27 21:04
技术突破 - BGE-Reasoner在BRIGHT基准测试中获得45.2分,以领先第二名3.6分的优势刷新历史最佳纪录 [1][5][7] - 该方案通过三阶段模块化框架(查询改写/向量检索/重排序)显著提升推理密集型检索性能 [2][6][16] - 内置向量模型BGE-Reasoner-Embed超越Seed1.5-Embedding、Qwen3-Embedding等基线模型 [5][9] 技术架构 - 采用Rewriter(基于Qwen2.5-7B微调)、Embedder(基于Qwen3-8B微调)、Reranker(基于Qwen3系列微调)的三模块端到端架构 [10][11][12] - 使用大模型合成覆盖数学/代码等多领域的高质量训练数据,解决数据稀缺问题 [6][10] - 在Reranker训练中引入强化学习,提升模型对困难样本的推理泛化能力 [6][12] 行业地位 - 超越蚂蚁集团与中山大学联合研发的DIVER(41.6分)、百度与人民大学等机构开发的ReasonRank(40.8分)等竞争对手 [5][7] - 由中科大、智源研究院、北邮、港理工等机构联合研发,是BGE系列模型的重要里程碑 [1][2] - 技术方案及训练数据将面向社区开源,推动领域研究发展 [2] 应用场景 - 专门针对需要多步逻辑推理、语义链整合和背景知识运用的复杂检索场景 [3][10] - 对RAG技术和AI Agent在深度研究等复杂推理任务中的发展具有决定性意义 [1][3] - BRIGHT基准包含StackExchange、LeetCode、数学竞赛等领域的真实查询数据 [3]
打破瓶颈,让RAG学会思考:中科大、智源等发布推理检索框架BGE-Reasoner
机器之心· 2025-08-27 16:36
机器之心发布 机器之心编辑部 人工智能的浪潮正将我们推向一个由 RAG 和 AI Agent 定义的新时代。然而,要让这些智能体真正「智能」,而非仅仅是信息的搬运工,就必须攻克一个横亘在所 有顶尖团队面前的核心难题。这个难题,就是 推理密集型信息检索(Reasoning-Intensive IR) 。 它不仅是当前 RAG 和 AI Agent 技术发展的关键瓶颈,更对大模型智能体和深度研究(DeepResearch)等应用场景的成败具有决定性意义。 正当全球研究者都在为此寻求突破之际,我们看到了一项来自中国的贡献: BGE-Reasoner 。 BGE-Reasoner 由来自中国科学技术大学、智源研究院、北京邮电大学与香港理工大学等机构的联合团队研发,是一套用于推理密集型信息检索任务的创新的端到 端解决方案。通过系统性的查询理解、向量检索与重排序,该方案可显著提升搜索引擎在推理密集型信息检索任务中的表现。 在权威评测基准 BRIGHT 上,BGE-Reasoner 取得 45.2 的测试得分,以显著优势刷新了该基准的最佳纪录。 作为 BGE 系列模型的又一重要里程碑,BGE-Reasoner 不仅实现了性 ...