RAG 的 Orchestration 优化之 Routing
根据不同查询将其路由到特定处理管道,这是适应多场景 RAG 架构的关键功能。需要决策机制来确定将使用哪些模块,依据模型输入或元数据信息进行选择。不同提示或组件有不同的路由机制
查询路由涉及将不同类型的查询定向到系统中最合适的检索或生成模块。这种方法可确保每个查询都由最合适的算法或数据源处理,从而优化准确性和效率
举个例子:当用户希望得到一个不涉及统计、关系的答案时,使用向量检索即可,当用户希望对结果进行统计时,使用数据库检索
此选择过程由 LLM 指导,LLM 会设置结果的格式以正确路由查询。在更复杂的场景中,路由可能会扩展到子链或其他代理,如 Multi-Documents Agent 模型所示
MetadataRouting
从查询中提取关键术语或实体,并结合块中的元数据优化路由
SemanticRouting
根据查询的语义信息,将其路由到不同的模块。
HybridRouting
结合语义分析和基于元数据的路由方法,以改进查询路由