RAG的核心思想是通过实时数据检索弥补这一缺陷——在生成答案前,系统先从外部数据源(如数据库、API或互联网)动态检索相关上下文,再结合LLM的知识生成更精准、实时的响应。但它们通常在处理动态、多步推理任务、适应性和复杂工作流的协调方面仍然存在不足。
rag三大组件
- 检索器(Retriever):从外部数据源(如向量数据库、知识图谱或网页)中搜索与查询相关的信息。相关技术:如BM25关键词匹配、密集向量搜索等。
- 增强器(Augmenter):对检索结果进行筛选、排序和整合,提取最相关的片段。相关技术:上下文重排序、多跳检索。
- 生成器(Generator):将增强后的上下文与LLM的预训练知识结合,生成自然语言回答。确保回答连贯且忠实于检索内容,避免出现幻觉。
RAG范式演进
RAG范式的对比
Naive RAG:基础实现
图片
Naive RAG是RAG范式的最初实现,其核心思想是通过简单的关键词检索来增强生成模型的能力。这种方法依赖于TF-IDF、BM25等传统的检索技术,从静态数据集中获取文档,并将其用于生成模型的输入。
优点:
- 简单易实现:由于依赖简单的关键词匹配,Naive RAG易于实现。
- 快速部署:适合需要快速上线的场景。
缺点:
- 缺乏上下文感知:由于仅依赖词汇匹配,无法捕捉查询的语义细微差别。
- 输出碎片化:生成的响应可能不连贯或过于通用。
- 可扩展性问题:在处理大规模数据集时表现不佳。
Advanced RAG:语义增强
图片
为了克服Naive RAG的局限性,Advanced RAG引入了语义理解和增强的检索技术。Advanced RAG使用密集向量搜索模型(如Dense Passage Retrieval, DPR)和神经排序算法来提高检索的精确度。
关键特性:
- 密集向量搜索:通过将查询和文档表示在高维向量空间中,实现更好的语义对齐。
- 上下文重排:使用神经模型重新排序检索到的文档,优先考虑最相关的信息。
- 多跳检索:支持跨多个文档的推理,适用于复杂查询。
适用场景:
- 高精度需求:如研究综合和个人化推荐。
Modular RAG:模块化设计
图片
Modular RAG代表了RAG范式的最新发展,强调灵活性和定制化。这种系统将检索和生成管道分解为独立的、可重用的组件,允许针对特定领域进行优化和任务适应。
创新点:
- 混合检索策略:结合稀疏和密集检索方法,以最大化不同查询类型的准确性。
- 工具集成:可以集成外部API、数据库或计算工具来处理专门任务。
- 可组合管道:允许独立替换、增强或重新配置检索器、生成器和其他组件。
适用场景:
- 复杂多领域任务:如金融分析和个性化推荐。
Graph RAG:图结构整合
图片
Graph RAG通过整合图结构数据来扩展传统的RAG系统。这些系统利用图数据中的关系和层次结构来增强多跳推理和上下文丰富。
特点:
- 节点连接性:捕捉实体之间的关系。
- 层次知识管理:通过图结构处理结构化和非结构化数据。
- 上下文丰富:通过图路径增加关系理解。
适用场景:
- 结构化数据任务:如医疗诊断和法律研究。
Agentic RAG:自主代理
Agentic RAG代表了一种范式转变,通过引入能够动态决策和优化工作流的自主代理来实现更高层次的灵活性和适应性。与静态系统不同,Agentic RAG采用迭代细化和自适应检索策略来处理复杂的实时和多领域查询。
关键特性:
- 自主决策:代理根据查询复杂性独立评估和管理检索策略。
- 迭代细化:通过反馈循环提高检索准确性和响应相关性。
- 工作流优化:动态协调任务,提高实时应用的效率。
适用场景:
- 动态适应性强:如客户支持和财务分析。
Agentic RAG
Agentic RAG概览
一、Agentic RAG的核心模式
- 反思
- 定义:智能体评估自己的决策和输出,识别错误和需要改进的领域。
- 主要优势:
a.启用迭代结果改进。
b.提高多步推理任务的准确性。
- 示例:在医疗诊断系统中,智能体根据检索到的数据进行迭代反馈,以完善诊断。
反思模式
2. 规划
- 定义:智能体创建结构化的工作流和任务序列,以高效解决问题。
- 主要优势:
a.通过分解任务,促进多步推理。
b.通过优化任务优先级,减少计算开销。
- 示例:金融分析系统规划数据检索任务,以评估风险并提供建议。
规划模式
3. 工具使用
- 定义:智能体与外部工具、API和知识库交互,以检索和处理数据。
- 主要优势:
a.扩展系统的能力,超越预训练知识。
b.通过整合外部资源,实现特定领域的应用。
- 示例:法律助理智能体从合同数据库中检索条款,并应用特定领域的规则进行合规性分析。
工具使用模式
4. 多智能体协作
- 定义:多个智能体协作,通过分工和共享信息及结果来解决复杂任务。
- 主要优势:
a.高效处理大规模和分布式问题。
b.结合专业智能体的能力,获得更好的结果。
- 示例: 在客户支持中,智能体协作以从常见问题解答(FAQ)中检索知识、生成响应并提供后续服务。 LawGlance通过利用多智能体工作流简化法律研究,检索相关文件,分析信息,并提供精确的法律见解。它整合了Crew AI、LangChain和Chroma,以检索法律文件、进行网络搜索,并提供针对用户查询的简洁、准确的答案。
多智能体协作模式
小结:这些模式构成了Agentic RAG系统的核心,使它们能够动态适应任务需求,通过自我评估改进决策,利用外部资源进行特定领域的推理,通过协作处理复杂、分布式的工作流。
二、Agentic RAG系统的分类
Agentic检索增强型生成(RAG)系统涵盖了各种架构和工作流,每种都针对特定任务和复杂程度进行了定制。
1. 单智能体RAG
图片
- 核心思想:由单个自主智能体管理检索和生成过程。
- 工作流程:
- 向智能体提交查询。
- 智能体从外部来源检索相关数据。
- 对数据进行处理并合成回复。
- 优点:
对于基本用例,架构简单。
易于实现和维护。
局限性:
可扩展性有限。
对于多步推理或大型数据集效果不佳。
2. 多智能体RAG
图片
- 核心思想:一组智能体协作执行复杂的检索和推理任务。
- 工作流程:
- 智能体动态划分任务(例如,检索、推理、合成)。
- 每个智能体专门负责特定的子任务。
- 将结果汇总并合成为连贯的输出。
- 优点:
对于分布式、多步任务表现更佳。
模块化程度更高,可扩展性更强。
局限性:
随着智能体数量的增加,协调复杂度上升。
智能体之间存在冗余或冲突的风险。
3. 分层智能体RAG
图片
- 核心思想:将智能体组织成层次结构,以便更好地进行任务优先级排序和委派。
- 工作流程:
- 顶层智能体在较低层级智能体之间协调子任务。
- 每个较低层级智能体处理流程中的特定部分。
- 结果在较高层级迭代优化并整合。
- 优点:
对于大型复杂任务具有可扩展性。
模块化设计便于实现专业化。
局限性:
需要复杂的协调机制。
在层级结构的较高层级可能出现瓶颈。
4. 纠错智能体RAG
图片
- 核心思想:通过反馈循环使智能体能够迭代评估和优化其输出。
- 工作流程:
- 智能体生成初始回复。
- 一个评判模块评估回复是否存在错误或不一致之处。
- 智能体根据反馈优化回复。
- 重复步骤2 - 3,直到输出达到质量标准。
- 优点:
通过迭代改进实现高准确性和可靠性。
对于容易出错或高风险任务很有用。
局限性:
计算开销增加。
反馈机制必须精心设计,以避免无限循环。
5. 自适应智能体RAG
图片
- 核心思想:根据任务要求动态调整检索策略和工作流程。
- 工作流程:
- 智能体评估查询及其上下文。
- 根据可用数据和用户需求实时调整检索策略。
- 使用动态工作流程合成回复。
- 优点:
对于各种任务和动态环境具有高度灵活性。
提高上下文相关性和用户满意度。
局限性:
设计强大的自适应机制具有挑战性。
实时调整会带来计算开销。
6. 基于图的智能体RAG
基于图的RAG系统通过整合基于图的数据结构进行高级推理,扩展了传统的RAG。
6.1 Agent - G:用于图RAG的智能体框架
图片
- 核心思想:使用图知识库和反馈循环,动态地将任务分配给专门的智能体。
- 工作流程:
- 从图知识库中提取关系(例如,疾病与症状的映射)。
- 用来自外部来源的非结构化数据进行补充。
- 使用评判模块验证结果并迭代改进。
- 优点:
结合了结构化和非结构化数据。
对于复杂任务具有模块化和可扩展性。
通过迭代优化确保高准确性。
6.2 GeAR:用于RAG的图增强智能体
图片
- 核心思想:通过图扩展技术和基于智能体的架构增强RAG系统。
- 工作流程:
- 扩展与查询相关的图,以更好地理解关系。
- 利用专门的智能体进行多跳推理。
- 将图结构和非结构化信息合成为回复。
- 优点:
在多跳推理场景中表现出色。
提高深度上下文任务的准确性。
能够动态适应复杂的查询环境。
7. 智能体文档工作流(ADW)
智能体文档工作流(ADW)通过利用智能体自动化以文档为中心的流程,对传统的检索增强生成(RAG)系统进行了扩展。
图片
工作流程
- 文档解析与结构化:
a.从诸如发票或合同等文档中提取结构化数据。
- 状态维护:
在多步骤工作流中跟踪上下文,以确保一致性。
知识检索:
从外部来源或特定领域的数据库中检索相关参考信息。
智能体编排:
应用业务规则,进行多步推理,并协调外部应用程序编程接口(API)。
可执行输出生成:
生成针对特定用例定制的结构化输出(例如,报告或摘要)。
智能体RAG框架的对比分析
传统RAG、智能体RAG以及智能体文档工作流(ADW)。该分析突出了它们各自的优势、劣势及最适用场景,为其在各种不同用例中的适用性提供了宝贵见解。
三种架构框架进行了全面的对比分析
关键要点
- 传统RAG最适合需要基本检索和生成能力的较简单任务。
- 智能体RAG在多智能体协作推理方面表现出色,适用于更复杂的多领域任务。
- 智能体文档工作流(ADW)为企业级应用(如合同分析和发票处理)提供定制化的、以文档为中心的解决方案。
参考文献:Agentic Retrieval-Augmented Generation: A Survey on Agentic RAG,https://arxiv.org/abs/2501.09136