【RAG】RAG范式演进及Agentic-RAG总结综述

RAG的核心思想是通过实时数据检索弥补这一缺陷——在生成答案前，系统先从外部数据源（如数据库、API或互联网）动态检索相关上下文，再结合LLM的知识生成更精准、实时的响应。。rag三大组件检索器（Retriever）：从外部数据源（如向量数据库、知识图谱或网页）中搜索与查询相关的信息。相关技术：如BM25关键词匹配、密集向量搜索等。增强器（Augmenter）:对检索结果进行筛选、排序和整合，提取

荔枝学Python

1572人浏览 · 2025-02-07 20:46:29

荔枝学Python · 2025-02-07 20:46:29 发布

RAG的核心思想是通过实时数据检索弥补这一缺陷——在生成答案前，系统先从外部数据源（如数据库、API或互联网）动态检索相关上下文，再结合LLM的知识生成更精准、实时的响应。但它们通常在处理动态、多步推理任务、适应性和复杂工作流的协调方面仍然存在不足。

rag三大组件

检索器（Retriever）：从外部数据源（如向量数据库、知识图谱或网页）中搜索与查询相关的信息。相关技术：如BM25关键词匹配、密集向量搜索等。
增强器（Augmenter）:对检索结果进行筛选、排序和整合，提取最相关的片段。相关技术：上下文重排序、多跳检索。
生成器（Generator）：将增强后的上下文与LLM的预训练知识结合，生成自然语言回答。确保回答连贯且忠实于检索内容，避免出现幻觉。

RAG范式演进

RAG范式的对比

Naive RAG：基础实现

Naive RAG是RAG范式的最初实现，其核心思想是通过简单的关键词检索来增强生成模型的能力。这种方法依赖于TF-IDF、BM25等传统的检索技术，从静态数据集中获取文档，并将其用于生成模型的输入。

优点：

简单易实现：由于依赖简单的关键词匹配，Naive RAG易于实现。
快速部署：适合需要快速上线的场景。

缺点：

缺乏上下文感知：由于仅依赖词汇匹配，无法捕捉查询的语义细微差别。
输出碎片化：生成的响应可能不连贯或过于通用。
可扩展性问题：在处理大规模数据集时表现不佳。

Advanced RAG：语义增强

为了克服Naive RAG的局限性，Advanced RAG引入了语义理解和增强的检索技术。Advanced RAG使用密集向量搜索模型（如Dense Passage Retrieval, DPR）和神经排序算法来提高检索的精确度。

关键特性：

密集向量搜索：通过将查询和文档表示在高维向量空间中，实现更好的语义对齐。
上下文重排：使用神经模型重新排序检索到的文档，优先考虑最相关的信息。
多跳检索：支持跨多个文档的推理，适用于复杂查询。

适用场景：

高精度需求：如研究综合和个人化推荐。

Modular RAG：模块化设计

Modular RAG代表了RAG范式的最新发展，强调灵活性和定制化。这种系统将检索和生成管道分解为独立的、可重用的组件，允许针对特定领域进行优化和任务适应。

创新点：

混合检索策略：结合稀疏和密集检索方法，以最大化不同查询类型的准确性。
工具集成：可以集成外部API、数据库或计算工具来处理专门任务。
可组合管道：允许独立替换、增强或重新配置检索器、生成器和其他组件。

适用场景：

复杂多领域任务：如金融分析和个性化推荐。

Graph RAG：图结构整合

Graph RAG通过整合图结构数据来扩展传统的RAG系统。这些系统利用图数据中的关系和层次结构来增强多跳推理和上下文丰富。

特点：

节点连接性：捕捉实体之间的关系。
层次知识管理：通过图结构处理结构化和非结构化数据。
上下文丰富：通过图路径增加关系理解。

适用场景：

结构化数据任务：如医疗诊断和法律研究。

Agentic RAG：自主代理

Agentic RAG代表了一种范式转变，通过引入能够动态决策和优化工作流的自主代理来实现更高层次的灵活性和适应性。与静态系统不同，Agentic RAG采用迭代细化和自适应检索策略来处理复杂的实时和多领域查询。

关键特性：

自主决策：代理根据查询复杂性独立评估和管理检索策略。
迭代细化：通过反馈循环提高检索准确性和响应相关性。
工作流优化：动态协调任务，提高实时应用的效率。

适用场景：

动态适应性强：如客户支持和财务分析。

👉[CSDN大礼包🎁：全网最全《LLM大模型入门+进阶学习资源包》免费分享（安全链接，放心点击）]()👈

Agentic RAG

Agentic RAG概览

一、Agentic RAG的核心模式

反思

定义：智能体评估自己的决策和输出，识别错误和需要改进的领域。
主要优势：
启用迭代结果改进。
提高多步推理任务的准确性。
示例：在医疗诊断系统中，智能体根据检索到的数据进行迭代反馈，以完善诊断。

反思模式

2. 规划

定义：智能体创建结构化的工作流和任务序列，以高效解决问题。
主要优势：
通过分解任务，促进多步推理。
通过优化任务优先级，减少计算开销。
示例：金融分析系统规划数据检索任务，以评估风险并提供建议。

规划模式

3. 工具使用

定义：智能体与外部工具、API和知识库交互，以检索和处理数据。
主要优势：
扩展系统的能力，超越预训练知识。
通过整合外部资源，实现特定领域的应用。
示例：法律助理智能体从合同数据库中检索条款，并应用特定领域的规则进行合规性分析。

工具使用模式

4. 多智能体协作

定义：多个智能体协作，通过分工和共享信息及结果来解决复杂任务。
主要优势：
高效处理大规模和分布式问题。
结合专业智能体的能力，获得更好的结果。
示例：在客户支持中，智能体协作以从常见问题解答（FAQ）中检索知识、生成响应并提供后续服务。 LawGlance通过利用多智能体工作流简化法律研究，检索相关文件，分析信息，并提供精确的法律见解。它整合了Crew AI、LangChain和Chroma，以检索法律文件、进行网络搜索，并提供针对用户查询的简洁、准确的答案。

多智能体协作模式

小结：这些模式构成了Agentic RAG系统的核心，使它们能够动态适应任务需求，通过自我评估改进决策，利用外部资源进行特定领域的推理，通过协作处理复杂、分布式的工作流。

二、Agentic RAG系统的分类

Agentic检索增强型生成（RAG）系统涵盖了各种架构和工作流，每种都针对特定任务和复杂程度进行了定制。

1. 单智能体RAG

核心思想：由单个自主智能体管理检索和生成过程。
工作流程：

向智能体提交查询。
智能体从外部来源检索相关数据。
对数据进行处理并合成回复。

优点：
对于基本用例，架构简单。
易于实现和维护。
局限性：
可扩展性有限。
对于多步推理或大型数据集效果不佳。

2. 多智能体RAG

核心思想：一组智能体协作执行复杂的检索和推理任务。
工作流程：

智能体动态划分任务（例如，检索、推理、合成）。
每个智能体专门负责特定的子任务。
将结果汇总并合成为连贯的输出。

优点：
对于分布式、多步任务表现更佳。
模块化程度更高，可扩展性更强。
局限性：
随着智能体数量的增加，协调复杂度上升。
智能体之间存在冗余或冲突的风险。

3. 分层智能体RAG

核心思想：将智能体组织成层次结构，以便更好地进行任务优先级排序和委派。
工作流程：

顶层智能体在较低层级智能体之间协调子任务。
每个较低层级智能体处理流程中的特定部分。
结果在较高层级迭代优化并整合。

优点：
对于大型复杂任务具有可扩展性。
模块化设计便于实现专业化。
局限性：
需要复杂的协调机制。
在层级结构的较高层级可能出现瓶颈。

4. 纠错智能体RAG

核心思想：通过反馈循环使智能体能够迭代评估和优化其输出。
工作流程：

智能体生成初始回复。
一个评判模块评估回复是否存在错误或不一致之处。
智能体根据反馈优化回复。
重复步骤2 - 3，直到输出达到质量标准。

优点：
通过迭代改进实现高准确性和可靠性。
对于容易出错或高风险任务很有用。
局限性：
计算开销增加。
反馈机制必须精心设计，以避免无限循环。

5. 自适应智能体RAG

核心思想：根据任务要求动态调整检索策略和工作流程。
工作流程：

智能体评估查询及其上下文。
根据可用数据和用户需求实时调整检索策略。
使用动态工作流程合成回复。

优点：
对于各种任务和动态环境具有高度灵活性。
提高上下文相关性和用户满意度。
局限性：
设计强大的自适应机制具有挑战性。
实时调整会带来计算开销。

6. 基于图的智能体RAG

基于图的RAG系统通过整合基于图的数据结构进行高级推理，扩展了传统的RAG。

6.1 Agent - G：用于图RAG的智能体框架

核心思想：使用图知识库和反馈循环，动态地将任务分配给专门的智能体。
工作流程：

从图知识库中提取关系（例如，疾病与症状的映射）。
用来自外部来源的非结构化数据进行补充。
使用评判模块验证结果并迭代改进。

优点：
结合了结构化和非结构化数据。
对于复杂任务具有模块化和可扩展性。
通过迭代优化确保高准确性。

6.2 GeAR：用于RAG的图增强智能体

核心思想：通过图扩展技术和基于智能体的架构增强RAG系统。
工作流程：

扩展与查询相关的图，以更好地理解关系。
利用专门的智能体进行多跳推理。
将图结构和非结构化信息合成为回复。

优点：
在多跳推理场景中表现出色。
提高深度上下文任务的准确性。
能够动态适应复杂的查询环境。

7. 智能体文档工作流（ADW）

智能体文档工作流（ADW）通过利用智能体自动化以文档为中心的流程，对传统的检索增强生成（RAG）系统进行了扩展。

工作流程

文档解析与结构化：

从诸如发票或合同等文档中提取结构化数据。

状态维护：

在多步骤工作流中跟踪上下文，以确保一致性。

知识检索：

从外部来源或特定领域的数据库中检索相关参考信息。

智能体编排：

应用业务规则，进行多步推理，并协调外部应用程序编程接口（API）。

可执行输出生成：

生成针对特定用例定制的结构化输出（例如，报告或摘要）。

智能体RAG框架的对比分析

传统RAG、智能体RAG以及智能体文档工作流（ADW）。该分析突出了它们各自的优势、劣势及最适用场景，为其在各种不同用例中的适用性提供了宝贵见解。

三种架构框架进行了全面的对比分析

关键要点

传统RAG最适合需要基本检索和生成能力的较简单任务。
智能体RAG在多智能体协作推理方面表现出色，适用于更复杂的多领域任务。
**智能体文档工作流（ADW）**为企业级应用（如合同分析和发票处理）提供定制化的、以文档为中心的解决方案。

读者福利：如果大家对大模型感兴趣，这套大模型学习资料一定对你有用

对于0基础小白入门：

如果你是零基础小白，想快速入门大模型是可以考虑的。

一方面是学习时间相对较短，学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

包括：大模型学习线路汇总、学习阶段，大模型实战案例，大模型学习视频，人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型！

😝有需要的小伙伴，可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓
在这里插入图片描述

👉AI大模型学习路线汇总👈

大模型学习路线图，整体分为7个大的阶段：（全套教程文末领取哈）

第一阶段： 从大模型系统设计入手，讲解大模型的主要方法；

第二阶段： 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用；

第三阶段： 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统；

第四阶段： 大模型知识库应用开发以LangChain框架为例，构建物流行业咨询智能问答系统；

第五阶段： 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型；

第六阶段： 以SD多模态大模型为主，搭建了文生图小程序案例；

第七阶段： 以大模型平台应用与开发为主，通过星火大模型，文心大模型等成熟大模型构建大模型行业应用。

👉大模型实战案例👈

光学理论是没用的，要学会跟着一起做，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战案例来学习。

在这里插入图片描述

👉大模型视频和PDF合集👈

观看零基础学习书籍和视频，看书籍和视频学习是最快捷也是最有效果的方式，跟着视频中老师的思路，从基础到深入，还是很容易入门的。
在这里插入图片描述

👉学会后的收获：👈

• 基于大模型全栈工程实现（前端、后端、产品经理、设计、数据分析等），通过这门课可获得不同能力；

• 能够利用大模型解决相关实际项目需求： 大数据时代，越来越多的企业和机构需要处理海量数据，利用大模型技术可以更好地处理这些数据，提高数据分析和决策的准确性。因此，掌握大模型应用开发技能，可以让程序员更好地应对实际项目需求；

• 基于大模型和企业数据AI应用开发，实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能， 学会Fine-tuning垂直训练大模型（数据准备、数据蒸馏、大模型部署）一站式掌握；

• 能够完成时下热门大模型垂直领域模型训练能力，提高程序员的编码能力： 大模型应用开发需要掌握机器学习算法、深度学习框架等技术，这些技术的掌握可以提高程序员的编码能力和分析能力，让程序员更加熟练地编写高质量的代码。

👉获取方式：

😝有需要的小伙伴，可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓
在这里插入图片描述

AI Agent技术社区

Agent 垂直技术社区，欢迎活跃、内容共建。

更多推荐

如何卸载openclaw

OpenClaw（俗称"龙虾"）是一个本地 AI 智能体平台，用于在电脑上部署自主运行的 AI 代理。

AI Agent技术社区

（已解决）安装openclaw龙虾[特殊字符]npm权限问题EACCES

先安装升级完成node和homebrew后。安装就很快了。但是遇到EACCESS问题！！！发现报错了。问题错误：核心问题是sharp解决（90%人遇到的）安装 macOS 编译工具很多人缺少，导致sharp无法编译。运行：xcode-select --install安装完成后重新执行：sharp编译需要 C++ 编译器和 node-gyp，这些都来自 Xcode CLI。