RAG 技术 06 - 后检索

发表于 2025-01-23 更新于 2025-02-02 分类于 2-深度学习， LLM开发工程师指南， RAG 阅读次数：本文字数： 550 阅读时长 ≈ 1 分钟

检索出问题相关的上下文后，如果将所有检索到的块直接送入 LLM，可能不是最佳选择，因为检索出来的文本可能包括冗余信息，或者文档长度太长需要压缩

根据文档与查询的相关性对文档进行排序，使用 reranker 模型重新排序检索结果

检索结果重排序Rerank-20241216135816

rerank 有两种规则实现文档排序

RAG 中的一个常见误解该过程是指尽可能多地检索相关文档并将其连接起来，形成一个冗长的文档检索提示是有益的。然而，过度的上下文可能会引入更多噪音，降低 LLM 对关键信息。解决这一问题的一种常见方法是压缩并选择检索到的内容

Compression-20250116093106

对于 self-Query retrieval 来说，在利用文档时，还可以根据用户查询与文档元数据过滤检索结果

自查询selfQuery-20241216135424

CRAG 则引入了一个轻量级检索评估器，用于评估检索到的文档的整体质量，提供触发不同知识检索操作（如 “正确”、“不正确” 或 “模糊”）的置信度

CRAG 还可以通过合并 Web 搜索来确定检索到的结果是否相关，从而解决静态语料库中的限制

Selection-20250116093147