作者 | AIGC面面观 

原文链接:RAG-Reasoning系统综述

点击下方卡片,关注“大模型之心Tech”公众号

戳我-> 领取大模型巨卷干货

>>点击进入→大模型没那么大Tech技术交流群

本文只做学术分享,如有侵权,联系删文,自动驾驶课程学习与技术交流群事宜,也欢迎添加小助理微信AIDriver004做进一步咨询

RAG-Reasoning演变路线
RAG-Reasoning演变路线

1. 背景与挑战

传统RAG通过外部知识注入缓解LLMs的幻觉问题,但在多步推理任务中表现不足;而纯推理方法易受知识缺失影响。两者的单向增强存在局限性:

  • (1)检索充分性不足;
  • (2)推理深度受限;
  • (3)系统适应性差。

协同RAG-推理框架(RAG ⇔ Reasoning),通过动态迭代的检索与推理交互提升性能

RAG-推理系统的概述
RAG-推理系统的概述

2. 推理增强的RAG(Reasoning-Enhanced RAG)

2.1 检索优化

  • 推理感知的查询重构:分解复杂查询(如多跳问题)、扩展语义(通过思维链推理)。
  • 检索策略规划:全局规划(如PAR-RAG生成多步检索蓝图)与自适应决策(如FIND根据查询复杂度选择策略)。
  • 检索模型增强:结合结构化知识(如GNN编码知识图谱)或显式推理(如CoT提升多跳QA的中间知识召回)。

2.2 整合增强

  • 相关性评估:使用自然语言推理(NLI)模型过滤无关内容,或训练LLMs在噪声上下文中忽略干扰。
  • 信息融合:通过概率推理(BeamAggR)、知识图谱(CRP-RAG)或渐进式聚合(DualRAG)构建连贯证据链。

2.3 生成增强

  • 上下文感知合成:动态选择知识模块(Open-RAG)、生成显式推理路径(SelfReasoning)。
  • 基于证据的生成控制:事实验证(Self-RAG的反思标记)、引用生成(RARR的连贯引文)、知识图谱锚定(TRACE)。

3. RAG增强的推理(RAG-Enhanced Reasoning)

3.1 外部知识检索

  • 知识库:从结构化数据库(如数学定理库、法律案例库)检索事实链支持演绎推理。
  • 网络检索:动态验证(VeraCT Scan)、迭代优化(RAG-Star)或专业领域检索(FRVA的医学文献)。
  • 工具调用:集成计算器(ReInvoke)、符号工具(SCIAGENT)或代码库(RAR)提升数值与逻辑准确性。

3.2 上下文检索

  • 先验经验:复用历史决策(RAHL)、多模态交互(JARVIS1)或结构化案例(CoPS)。
  • 示例检索:基于语义相似性选择演示(PERC的伪代码检索)或标注数据增强关系识别(RE4)。

4. 协同RAG-推理框架(Synergized RAG-Reasoning)

4.1 推理工作流

  • 链式结构:IRCoT在推理步骤间插入检索,CoV-RAG通过验证链修正错误。
  • 树式结构:ToT扩展多逻辑路径(RATT),MCTS动态优化搜索(AirRAG)。
  • 图式结构:Walk-on-Graph(StructRAG)与Think-on-Graph(GraphReader)结合图遍历与显式子图锚定。

4.2 代理编排

  • 单代理系统:ReAct交替执行推理与检索,DeepRAG通过自省控制检索需求,强化学习(WebGPT)优化搜索策略。
  • 多代理系统:分布式架构(Collab-RAG)与集中式架构(HM-RAG)协同处理多源数据与任务分解。

5. 未来方向

  • 效率优化:潜在推理加速、预算感知检索规划与模型压缩。
  • 人机协作:意图建模、交互式接口与个性化推理策略。
  • 多模态检索:跨模态推理与统一检索器开发。
  • 可信检索:对抗攻击防御、动态水印与多维评估基准。

6.基准测试

任务类别下的代表性知识和推理密集型基准概述
任务类别下的代表性知识和推理密集型基准概述
  • 局限性:现有方法在检索充分性、推理深度与动态适应性方面仍需突破。

参考

https://arxiv.org/pdf/2507.09477


大模型之心Tech知识星球交流社区

我们创建了一个全新的学习社区 —— “大模型之心Tech”知识星球,希望能够帮你把复杂的东西拆开,揉碎,整合,帮你快速打通从0到1的技术路径。 

星球内容包含:每日大模型相关论文/技术报告更新、分类汇总(开源repo、大模型预训练后训练知识蒸馏量化推理模型MoE强化学习RAG提示工程等多个版块)、科研/办公助手AI创作工具/产品测评、升学&求职&岗位推荐,等等。

星球成员平均每天花费不到0.3元,加入后3天内不满意可随时退款,欢迎扫码加入一起学习一起卷!