RAG 的 Orchestration 优化之 Scheduling

发表于 2024-12-03 更新于 2025-01-18 分类于 2-深度学习， LLM开发工程师指南， RAG ， NextRAG 阅读次数：本文字数： 695 阅读时长 ≈ 1 分钟

随着 RAG 系统的复杂性和适应性的提升，调度模块能够有效地管理整个流程。它在模块化 RAG 系统中发挥着关键作用，帮助识别需要外部数据检索的关键时刻，评估生成结果的质量，并决定是否需要进一步的处理。调度模块常用于递归、迭代和自适应检索场景，确保系统能够在合适的时机停止生成或启动新的检索过程

Scheduling-RuleJudge

后续步骤由一组预设规则控制。通常，系统通过评分机制评估生成的答案质量，是否继续或停止生成取决于这些分数是否超过了预定的阈值，阈值通常与单个 token 的置信度相关

Scheduling-LLMJudge

LLM 能够独立判断后续操作的流程。有两种主要方法可以实现这一能力。第一种方法利用 LLM 的上下文学习能力，通过提示工程来判断是否继续。这种方法的优势在于无需对模型进行微调，然而其判断结果取决于 LLM 是否严格遵循所提供的指令。

第二种方法通过微调 LLM，使其生成特定的 token 来触发操作。这一技术来源于 Toolformer，并已集成到 Self-RAG 等框架中。此方法能够更直接地控制 LLM 的行为，提高其对特定对话上下文触发条件的响应能力。然而，这需要大量符合指令集的微调数据

Scheduling-KnowledgeGuide

除了规则判断和完全依赖 LLM 控制的方式之外，知识引导调度是一种更灵活的中间方法。它利用知识图谱引导检索和生成流程，具体做法是从知识图谱中提取与问题相关的信息并构建推理链。推理链由一系列逻辑相关的节点组成，每个节点提供解决问题的关键信息。基于这些节点的信息，可以分别执行检索和内容生成。这种方法不仅提高了问题解决的效率和准确性，还使生成的解释更加清晰