RAG 的预检索 PreRetrieval 优化之 QueryTrasformation

与 QueryExpansion 不同,QueryTrasformation 的目的是基于原始 prompt 生成新的 prompt,使用新的 prompt 去检索知识库

这个转换的原因是原始 prompt 可能存在字符紊乱、错别字问题

重写 Rewrite

将用户的查询重构为 LLM 更容易理解且检索器更容易使用的格式。在这里,您首先通过微调的语言模型处理用户查询,以优化和构建它。如图所示,提问中经常涉及:文字语序错乱、同义词替换等问题,直接去向量数据库检索,提取的内容有问题,因此在正式检索前,先使用 llm 优化问题

QueryTrasformation-20250116091707

HyDE

HyDE 技术与前面描述的假设问题索引方法相反,该技术首先使用 llm 回答用户查询,然后使用答案在数据库实现检索,以在存储中获取最佳匹配数据。

QueryTrasformation-20250116091707-1

Step-BackPrompt

原始查询被抽象转化为高级概念问题(后退问题)。在 RAG 系统,包括退一步问题和原始问题查询用于检索,它们的结果被组合在一起生成语言模型的答案。