RAGFlow自动化脚本套件：自定义解析+回答质量评估+参数自动调优

2025-03-13 11:29

最近 MCP（大模型上下文协议）比较火，花了点时间研究了下和 RAG 的协作架构，后续整理出心得后再发出。言归正传，之前文章里详细介绍了 RAGFlow 的 Python api 用法，今天结合几篇法律法规文档来给大家做个简单演示，抛砖引玉。这篇主要介绍三个脚本示例，分别是：数据处理与系统配置，系统测试，参数优化脚本。

最近 MCP（大模型上下文协议）比较火，花了点时间研究了下和 RAG 的协作架构，后续整理出心得后再发出。

言归正传，之前文章里详细介绍了 RAGFlow 的 Python api 用法，今天结合几篇法律法规文档来给大家做个简单演示，抛砖引玉。这篇主要介绍三个脚本示例，分别是：数据处理与系统配置，系统测试，参数优化脚本。这套自动化脚本相比 RAGFlow 的 Web 界面提供了三个关键优势：

自动化与效率：将需要人工数小时完成的操作缩减为几分钟的全自动流程

系统化与可重复：确保测试和优化过程的客观性、系统性和可重复性

可编程与可扩展：可以根据具体需求调整配置、测试方法和优化策略

这种类型的脚本可以被视为 RAGFlow 的"增强配套工具"，通过代码方式扩展了基础平台的能力，做深度业务场景适配时会灵活些。

1、数据处理与系统配置脚本

1.1相比 web 界面优势

自动化流程处理

一键式配置：从数据集创建、文档上传到聊天助手配置的全流程自动化

批量处理能力：可以一次性处理整个目录的文档

流程控制：自动等待文档解析完成后再创建聊天助手，确保流程顺序合理

灵活性与可定制性

灵活参数调整：可以在代码中直接调整各种参数而无需在界面中逐一点击

条件处理：可以添加逻辑判断，根据不同情况执行不同操作

错误处理：内置错误处理机制，出现问题时提供更详细的信息

可复用性

环境复制：可以在不同环境中复用相同的配置脚本

版本控制：配置可以纳入代码版本控制系统，便于跟踪变更

标准化部署：确保不同实例使用完全相同的配置

集成能力

可与其他系统集成：作为更大工作流的一部分

计划任务：可以作为定时任务自动运行

与测试脚本衔接：可与测试脚本无缝衔接，自动完成配置和测试

1.2目前实现的灵活配置

数据集配置:

自定义数据集名称和描述

配置使用的嵌入模型(BAAI/bge-m3)

使用专为法律文档设计的分块方法(chunk_method="laws")

文档处理:

支持多种文档格式(docx, doc, pdf, txt)的自动处理

批量上传文档

异步解析文档并监控进度

聊天助手配置:

自定义助手名称

关联到创建的法律法规数据集

1.3可添加的其他配置选项

数据集高级配置

复制

def create_legal_dataset(rag_object, dataset_name="法规知识库"):
    # 添加更多高级配置
    dataset = rag_object.create_dataset(
        name=dataset_name,
        descriptinotallow="包含生物安全法等法律法规文档",
        embedding_model="BAAI/bge-m3",
        chunk_method="laws",
        permissinotallow="team",  # 设置为团队可访问
        parser_cnotallow={
            "raptor": {"user_raptor": False}
        }  # 为法律文档添加特定的解析器配置
    )
    return dataset

文档元数据配置

复制

def upload_documents_with_metadata(dataset, docs_path):
    documents = []
    for filename in os.listdir(docs_path):
        if filename.endswith(('.docx', '.doc', '.pdf', '.txt')):
            file_path = os.path.join(docs_path, filename)
            with open(file_path, "rb") as f:
                blob = f.read()
                # 添加元数据
                documents.append({
                    "display_name": filename,
                    "blob": blob,
                    "meta_fields": {
                        "法律类型": "行政法规" if "条例" in filename else "法律",
                        "颁布年份": filename.split("（")[1].split("）")[0] if "（" in filename else "未知",
                        "效力级别": "国家级"
                    }
                })
    dataset.upload_documents(documents)

文档解析自定义配置

复制

def customize_document_parsing(dataset, doc_ids):
    # 获取文档并更新解析配置
    for doc_id in doc_ids:
        docs = dataset.list_documents(id=doc_id)
        if docs:
            doc = docs[0]
            # 更新文档解析配置
            doc.update({
                "chunk_method": "laws",
                "parser_config": {
                    "raptor": {"user_raptor": True}
                }
            })
    # 然后解析文档
    dataset.async_parse_documents(doc_ids)

聊天助手高级配置

复制

def create_legal_assistant(rag_object, dataset_id, assistant_name="法规助手"):
    # 创建具有高级配置的聊天助手
    assistant = rag_object.create_chat(
        name=assistant_name,
        dataset_ids=[dataset_id],
        llm={
            "model_name": "deepseek-ai/DeepSeek-R1-Distill-Qwen-32B",
            "temperature": 0.1,
            "top_p": 0.3,
            "presence_penalty": 0.2,
            "frequency_penalty": 0.7,
            "max_token": 1024
        },
        prompt={
            "similarity_threshold": 0.2,  # 设置相似度阈值
            "keywords_similarity_weight": 0.7,  # 关键词相似度权重
            "top_n": 8,  # 检索topN文档
            "rerank_model": "BAAI/bge-reranker-v2-m3",  # 使用重排序模型
            "prompt": """你是一位专业的法律顾问，精通中国法律法规，尤其是生物安全法等相关法规。
请基于检索到的法律条文，准确回答用户的问题。
回答时请：
1. 引用具体的法律条款编号
2. 解释法律条文的含义
3. 如有必要，说明条文之间的关联
4. 保持客观，不要添加个人观点
5. 如果检索结果不足以回答问题，请明确说明
{knowledge}
"""
        }
    )
    return assistant

多数据关联与权限管理

复制

def setup_multiple_datasets(rag_object):
    # 创建多个专题数据集
    datasets = []
    topics = ["生物安全法", "传染病防治法", "野生动物保护法"]
    
    for topic in topics:
        dataset = rag_object.create_dataset(
            name=f"{topic}知识库",
            descriptinotallow=f"专门针对{topic}的法律法规解析",
            embedding_model="BAAI/bge-m3",
            chunk_method="laws",
            permissinotallow="team"  # 团队共享
        )
        datasets.append(dataset)
    
    # 创建综合法律助手，关联所有数据集
    dataset_ids = [dataset.id for dataset in datasets]
    assistant = create_legal_assistant(rag_object, dataset_ids, "综合法律法规顾问")
    
    return datasets, assistant

上述这些高级配置可以根据实际需求进行组合和调整，不必拘泥于我的写法

2、系统测试脚本

自动生成不同类型的测试问题、收集系统回答、使用大模型评估回答质量、生成详细评估报告。

支持四种典型法律问题类型（直接引用类、概念解释类、场景应用类、跨条款关联类）的系统化测试。相比 Web 界面提供了更加好全面、客观的自动化测试与评估工具。

2.1测试问题分类

设计了四种类型的测试问题：

直接引用类：询问特定条款的内容

概念解释类：询问法律中的概念定义

场景应用类：提出实际场景，询问适用的法律条款

跨条款关联类：需要综合多个条款回答的问题

2.2评估指标

从五个维度评估回答质量：

准确性：回答是否引用了正确的法律条款

完整性：是否包含了所有相关条款

解释质量：对法律条文的解释是否清晰、准确

引用格式：是否正确引用了条款编号

总体评分：综合以上几点的总体评价

3、参数优化脚本

自动测试多种参数组合、创建临时测试助手、评估每种组合的性能、识别最佳配置方案。具体来说，大家可以试下初步探索相似度阈值、关键词权重、返回文档数量等不同的组合效果。

Web 界面相对而言，只能手动调整一组参数后进行主观评估，而使用这种类型的脚本可以自动比较多组参数效果。需要说明的是，这里列出的参数优化方案只是示例，大家可以根据具体业务需求进行灵活调整。

使用网格搜索方法，测试不同参数组合：

相似度阈值：[0.1, 0.15, 0.2, 0.25]

关键词权重：[0.6, 0.7, 0.8, 0.9]

返回条文数量：[8, 10, 12, 15]

4、其他

除了上述提到的参考技巧外，还可以测试不同的嵌入模型和重排序模型，以及结合自动评估和人工评估。

Anyway，设计一个符合特定文档结构特点以及业务目标的脚本组合，总是多快好省的。

Dify+RAGFlow:1+1＞2的混合架构，详细教程+实施案例

企业在落地 RAG 知识库时， Dify 和 RAGFlow 这两个开源框架应该选择哪个？这也是我一直以来做RAG咨询时，经常被企业方问到的问题之一。一般来说，如果需要处理特别复杂的文档和非结构化数据，RAGFlow 是优选。

4/7/2025 7:00:00 AM

韦东东

RAGFlow+DeepSeek-R1:14b落地案例分享（足够详细）：机加工行业设备维保场景

看到一个段子说，春节开工以后，中国有 5000 万家企业老板担心会错过 DeepSeek。虽然感觉有点瞎玩梗，但 DeepSeek 无疑已是当下所谓大模型企业应用落地的"房间里的大象"。不过想想，其实子弹也才刚刚飞了一个月而已。

2/24/2025 9:33:10 AM

韦东东

万字长文：说清MCP的前世今生+RAGFlow整合应用示例

上篇文章给大家预告了我在研究些 RAG MCP（大模型上下文协议）的事，前后断断续续写了四天，终于完成了这篇稿子，这篇试图说清楚两个事情：1、从复杂提示词引导模型调用工具开始，到 MCP 作为统一协议标准的变化过程；2、小试牛刀的演示下在传统 RAG 基础上，针对机械加工场景结合 MCP 的一些功能延展示例。以下，enjoy:1、先说说大模型 API 调用先简单回顾下最简单的大模型基础聊天应用开发，也就是直接按照目标 LLM 的官方 API 文档进行请求的做法。例如，如果我们要通过 Python 调用 DeepSeek-R1 模型进行问答，按照官方文档说明示例如下：因为大多数模型厂商都是兼容 OpenAI 规范的，也就是说在使用 OpenAI SDK 请求方式下，直接替换上述的 base_url 换成其他模型地址，都是可以实现请求响应的。

3/21/2025 9:00:00 AM

韦东东

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ Haisnap横空出世，小白用户也能轻松打造AI应用 kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o 本地部署DeepSeek+DiFy平台构建智能体应用韩国初创公司 RLWRLD 获 1480 万美元融资，致力于机器人基础模型开发 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片击败DeepSeek-R1！豆包新推理模型仅用前者参数量1/3！还将开源两个基准，瞄准通用推理能力！

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度苹果深度学习 AI视频模态人形机器人驾驶 xAI 文本搜索字节跳动大语言模型 Copilot Claude 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉 DeepMind 训练

顶部

RAGFlow自动化脚本套件：自定义解析+回答质量评估+参数自动调优

1、数据处理与系统配置脚本

1.1相比 web 界面优势

1.2目前实现的灵活配置

1.3可添加的其他配置选项

2、系统测试脚本

2.1测试问题分类

2.2评估指标

3、参数优化脚本

4、其他

相关资讯

Dify+RAGFlow:1+1＞2的混合架构，详细教程+实施案例

RAGFlow+DeepSeek-R1:14b落地案例分享（足够详细）：机加工行业设备维保场景

万字长文：说清MCP的前世今生+RAGFlow整合应用示例