RAG 技术 05 - 检索

发表于 2025-01-23 更新于 2025-02-02 分类于 2-深度学习， LLM开发工程师指南， RAG 阅读次数：本文字数： 479 阅读时长 ≈ 1 分钟

检索是 RAG 的核心，提供了准确的上下文才能正确输出答案，如果提供无关甚至错误的上下文，那么将得到错误答案

检索的方法是比较 Query 与文档的差异，选择差异小的文档输出，“比较” 不是通过直接比较 Query 与文档的文本内容，而是通过比较两者的索引

在实际使用中，以上方法可以组合使用，形成所谓的 “混合检索”，比如关键词 + 向量检索

预先为用户的问题生成几个回答，然后使用使用回答去检索而不是使用问题。使用

![[RAG 技术 05 - 检索 - 20250124151106.png]]

对不同复杂程度的问题进行分而治之，对于复杂的问题，可以采用多步 llm 去解决，对于简单的问题，甚至 llm 自身就可回答

如此也降低了每次使用 llm 的 prompt 的依赖