【RAG】RAG范式演进及Agentic-RAG总结综述

2025-02-06 01:50

RAG的核心思想是通过实时数据检索弥补这一缺陷——在生成答案前，系统先从外部数据源（如数据库、API或互联网）动态检索相关上下文，再结合LLM的知识生成更精准、实时的响应。但它们通常在处理动态、多步推理任务、适应性和复杂工作流的协调方面仍然存在不足。 rag三大组件检索器（Retriever）：从外部数据源（如向量数据库、知识图谱或网页）中搜索与查询相关的信息。

RAG的核心思想是通过实时数据检索弥补这一缺陷——在生成答案前，系统先从外部数据源（如数据库、API或互联网）动态检索相关上下文，再结合LLM的知识生成更精准、实时的响应。但它们通常在处理动态、多步推理任务、适应性和复杂工作流的协调方面仍然存在不足。

rag三大组件

检索器（Retriever）：从外部数据源（如向量数据库、知识图谱或网页）中搜索与查询相关的信息。相关技术：如BM25关键词匹配、密集向量搜索等。
增强器（Augmenter）:对检索结果进行筛选、排序和整合，提取最相关的片段。相关技术：上下文重排序、多跳检索。
生成器（Generator）：将增强后的上下文与LLM的预训练知识结合，生成自然语言回答。确保回答连贯且忠实于检索内容，避免出现幻觉。

RAG范式演进

RAG范式的对比

Naive RAG：基础实现

图片

Naive RAG是RAG范式的最初实现，其核心思想是通过简单的关键词检索来增强生成模型的能力。这种方法依赖于TF-IDF、BM25等传统的检索技术，从静态数据集中获取文档，并将其用于生成模型的输入。

优点：

简单易实现：由于依赖简单的关键词匹配，Naive RAG易于实现。
快速部署：适合需要快速上线的场景。

缺点：

缺乏上下文感知：由于仅依赖词汇匹配，无法捕捉查询的语义细微差别。
输出碎片化：生成的响应可能不连贯或过于通用。
可扩展性问题：在处理大规模数据集时表现不佳。

Advanced RAG：语义增强

图片

为了克服Naive RAG的局限性，Advanced RAG引入了语义理解和增强的检索技术。Advanced RAG使用密集向量搜索模型（如Dense Passage Retrieval, DPR）和神经排序算法来提高检索的精确度。

关键特性：

密集向量搜索：通过将查询和文档表示在高维向量空间中，实现更好的语义对齐。
上下文重排：使用神经模型重新排序检索到的文档，优先考虑最相关的信息。
多跳检索：支持跨多个文档的推理，适用于复杂查询。

适用场景：

高精度需求：如研究综合和个人化推荐。

Modular RAG：模块化设计

图片

Modular RAG代表了RAG范式的最新发展，强调灵活性和定制化。这种系统将检索和生成管道分解为独立的、可重用的组件，允许针对特定领域进行优化和任务适应。

创新点：

混合检索策略：结合稀疏和密集检索方法，以最大化不同查询类型的准确性。
工具集成：可以集成外部API、数据库或计算工具来处理专门任务。
可组合管道：允许独立替换、增强或重新配置检索器、生成器和其他组件。

适用场景：

复杂多领域任务：如金融分析和个性化推荐。

Graph RAG：图结构整合

图片

Graph RAG通过整合图结构数据来扩展传统的RAG系统。这些系统利用图数据中的关系和层次结构来增强多跳推理和上下文丰富。

特点：

节点连接性：捕捉实体之间的关系。
层次知识管理：通过图结构处理结构化和非结构化数据。
上下文丰富：通过图路径增加关系理解。

适用场景：

结构化数据任务：如医疗诊断和法律研究。

Agentic RAG：自主代理

Agentic RAG代表了一种范式转变，通过引入能够动态决策和优化工作流的自主代理来实现更高层次的灵活性和适应性。与静态系统不同，Agentic RAG采用迭代细化和自适应检索策略来处理复杂的实时和多领域查询。

关键特性：

自主决策：代理根据查询复杂性独立评估和管理检索策略。
迭代细化：通过反馈循环提高检索准确性和响应相关性。
工作流优化：动态协调任务，提高实时应用的效率。

适用场景：

动态适应性强：如客户支持和财务分析。

Agentic RAG

Agentic RAG概览

一、Agentic RAG的核心模式

反思

定义：智能体评估自己的决策和输出，识别错误和需要改进的领域。
主要优势：

a.启用迭代结果改进。

b.提高多步推理任务的准确性。

示例：在医疗诊断系统中，智能体根据检索到的数据进行迭代反馈，以完善诊断。

反思模式

2. 规划

定义：智能体创建结构化的工作流和任务序列，以高效解决问题。
主要优势：

a.通过分解任务，促进多步推理。

b.通过优化任务优先级，减少计算开销。

示例：金融分析系统规划数据检索任务，以评估风险并提供建议。

规划模式

3. 工具使用

定义：智能体与外部工具、API和知识库交互，以检索和处理数据。
主要优势：

a.扩展系统的能力，超越预训练知识。

b.通过整合外部资源，实现特定领域的应用。

示例：法律助理智能体从合同数据库中检索条款，并应用特定领域的规则进行合规性分析。

工具使用模式

4. 多智能体协作

定义：多个智能体协作，通过分工和共享信息及结果来解决复杂任务。
主要优势：

a.高效处理大规模和分布式问题。

b.结合专业智能体的能力，获得更好的结果。

示例：在客户支持中，智能体协作以从常见问题解答（FAQ）中检索知识、生成响应并提供后续服务。 LawGlance通过利用多智能体工作流简化法律研究，检索相关文件，分析信息，并提供精确的法律见解。它整合了Crew AI、LangChain和Chroma，以检索法律文件、进行网络搜索，并提供针对用户查询的简洁、准确的答案。

多智能体协作模式

小结：这些模式构成了Agentic RAG系统的核心，使它们能够动态适应任务需求，通过自我评估改进决策，利用外部资源进行特定领域的推理，通过协作处理复杂、分布式的工作流。

二、Agentic RAG系统的分类

Agentic检索增强型生成（RAG）系统涵盖了各种架构和工作流，每种都针对特定任务和复杂程度进行了定制。

1. 单智能体RAG

图片

核心思想：由单个自主智能体管理检索和生成过程。
工作流程：

向智能体提交查询。
智能体从外部来源检索相关数据。
对数据进行处理并合成回复。

优点：
对于基本用例，架构简单。
易于实现和维护。
局限性：
可扩展性有限。
对于多步推理或大型数据集效果不佳。

2. 多智能体RAG

图片

核心思想：一组智能体协作执行复杂的检索和推理任务。
工作流程：

智能体动态划分任务（例如，检索、推理、合成）。
每个智能体专门负责特定的子任务。
将结果汇总并合成为连贯的输出。

优点：
对于分布式、多步任务表现更佳。
模块化程度更高，可扩展性更强。
局限性：
随着智能体数量的增加，协调复杂度上升。
智能体之间存在冗余或冲突的风险。

3. 分层智能体RAG

图片

核心思想：将智能体组织成层次结构，以便更好地进行任务优先级排序和委派。
工作流程：

顶层智能体在较低层级智能体之间协调子任务。
每个较低层级智能体处理流程中的特定部分。
结果在较高层级迭代优化并整合。

优点：
对于大型复杂任务具有可扩展性。
模块化设计便于实现专业化。
局限性：
需要复杂的协调机制。
在层级结构的较高层级可能出现瓶颈。

4. 纠错智能体RAG

图片

核心思想：通过反馈循环使智能体能够迭代评估和优化其输出。
工作流程：

智能体生成初始回复。
一个评判模块评估回复是否存在错误或不一致之处。
智能体根据反馈优化回复。
重复步骤2 - 3，直到输出达到质量标准。

优点：
通过迭代改进实现高准确性和可靠性。
对于容易出错或高风险任务很有用。
局限性：
计算开销增加。
反馈机制必须精心设计，以避免无限循环。

5. 自适应智能体RAG

图片

核心思想：根据任务要求动态调整检索策略和工作流程。
工作流程：

智能体评估查询及其上下文。
根据可用数据和用户需求实时调整检索策略。
使用动态工作流程合成回复。

优点：
对于各种任务和动态环境具有高度灵活性。
提高上下文相关性和用户满意度。
局限性：
设计强大的自适应机制具有挑战性。
实时调整会带来计算开销。

6. 基于图的智能体RAG

基于图的RAG系统通过整合基于图的数据结构进行高级推理，扩展了传统的RAG。

6.1 Agent - G：用于图RAG的智能体框架

图片

核心思想：使用图知识库和反馈循环，动态地将任务分配给专门的智能体。
工作流程：

从图知识库中提取关系（例如，疾病与症状的映射）。
用来自外部来源的非结构化数据进行补充。
使用评判模块验证结果并迭代改进。

优点：
结合了结构化和非结构化数据。
对于复杂任务具有模块化和可扩展性。
通过迭代优化确保高准确性。

6.2 GeAR：用于RAG的图增强智能体

图片

核心思想：通过图扩展技术和基于智能体的架构增强RAG系统。
工作流程：

扩展与查询相关的图，以更好地理解关系。
利用专门的智能体进行多跳推理。
将图结构和非结构化信息合成为回复。

优点：
在多跳推理场景中表现出色。
提高深度上下文任务的准确性。
能够动态适应复杂的查询环境。

7. 智能体文档工作流（ADW）

智能体文档工作流（ADW）通过利用智能体自动化以文档为中心的流程，对传统的检索增强生成（RAG）系统进行了扩展。

图片

工作流程

文档解析与结构化：

a.从诸如发票或合同等文档中提取结构化数据。

状态维护：

在多步骤工作流中跟踪上下文，以确保一致性。

知识检索：

从外部来源或特定领域的数据库中检索相关参考信息。

智能体编排：

应用业务规则，进行多步推理，并协调外部应用程序编程接口（API）。

可执行输出生成：

生成针对特定用例定制的结构化输出（例如，报告或摘要）。

智能体RAG框架的对比分析

传统RAG、智能体RAG以及智能体文档工作流（ADW）。该分析突出了它们各自的优势、劣势及最适用场景，为其在各种不同用例中的适用性提供了宝贵见解。

三种架构框架进行了全面的对比分析

关键要点

传统RAG最适合需要基本检索和生成能力的较简单任务。
智能体RAG在多智能体协作推理方面表现出色，适用于更复杂的多领域任务。
智能体文档工作流（ADW）为企业级应用（如合同分析和发票处理）提供定制化的、以文档为中心的解决方案。

参考文献：Agentic Retrieval-Augmented Generation: A Survey on Agentic RAG，https://arxiv.org/abs/2501.09136

从概念到应用，清华团队开发DeepTFBU工具包助力基因表达精准调控

编辑 | 萝卜皮增强子通过与转录因子 (TF) 相互作用，在各种生物过程中充当基因表达的关键调节器。虽然转录因子结合位点 (TFBS) 被广泛认为是 TF 结合和增强子活性的关键决定因素，但其周围背景序列的重要作用仍有待定量表征。清华大学的研究团队提出了转录因子结合单元（transcription factor binding unit，TFBU）概念，通过使用深度学习模型量化 TFBS 周围上下文序列的影响，模块化地建模增强子。

2/21/2025 4:01:00 PM

ScienceAI

TensorFlow 2.8.0正式上线，修复众多Bug，发布50多个漏洞补丁

TensorFlow 2.8.0 来了。

2/8/2022 2:33:00 PM

机器之心

无需文本标注，TF-T2V把AI量产视频的成本打下来了！华科阿里等联合打造

在过去短短两年内，随着诸如 LAION-5B 等大规模图文数据集的开放，Stable Diffusion、DALL-E 2、ControlNet、Composer ，效果惊人的图片生成方法层出不穷。图片生成领域可谓狂飙突进。然而，与图片生成相比，视频生成仍存在巨大挑战。首先，视频生成需要处理更高维度的数据，考虑额外时间维度带来的时序建模问题，因此需要更多的视频 - 文本对数据来驱动时序动态的学习。然而，对视频进行准确的时序标注非常昂贵。这限制了视频 - 文本数据集的规模，如现有 WebVid10M 视频数据集包含

1/8/2024 11:21:00 AM

机器之心

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片本地部署DeepSeek+DiFy平台构建智能体应用 OPPO 小布助手网页版上线，接入满血版 DeepSeek kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度苹果深度学习 AI视频模态人形机器人 xAI 驾驶字节跳动文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉训练大型语言模型

顶部

【RAG】RAG范式演进及Agentic-RAG总结综述

RAG范式演进

Naive RAG：基础实现

Advanced RAG：语义增强

Modular RAG：模块化设计

Graph RAG：图结构整合

Agentic RAG：自主代理

Agentic RAG

一、Agentic RAG的核心模式

二、Agentic RAG系统的分类

1. 单智能体RAG

2. 多智能体RAG

3. 分层智能体RAG

4. 纠错智能体RAG

5. 自适应智能体RAG

6. 基于图的智能体RAG

6.1 Agent - G：用于图RAG的智能体框架

6.2 GeAR：用于RAG的图增强智能体

7. 智能体文档工作流（ADW）

工作流程

智能体RAG框架的对比分析

关键要点

相关资讯

从概念到应用，清华团队开发DeepTFBU工具包助力基因表达精准调控

TensorFlow 2.8.0正式上线，修复众多Bug，发布50多个漏洞补丁

无需文本标注，TF-T2V把AI量产视频的成本打下来了！华科阿里等联合打造