RAG 的 PostRetrieval 优化之 Compression
RAG 中的一个常见误解该过程是指尽可能多地检索相关文档并将其连接起来,形成一个冗长的文档检索提示是有益的。然而,过度的上下文可能会引入更多噪音,降低 LLM 对关键信息。解决这一问题的一种常见方法是压缩并选择检索到的内容。
尤其在处理大型数据集中,可以保持效率而不牺牲响应准确性时,上下文提示压缩特别有用
RAG 中的一个常见误解该过程是指尽可能多地检索相关文档并将其连接起来,形成一个冗长的文档检索提示是有益的。然而,过度的上下文可能会引入更多噪音,降低 LLM 对关键信息。解决这一问题的一种常见方法是压缩并选择检索到的内容。
尤其在处理大型数据集中,可以保持效率而不牺牲响应准确性时,上下文提示压缩特别有用