年轻人起来冲

RAG 技术 05 - 检索

发表于 2025-01-23 更新于 2025-02-02 分类于 2-深度学习， LLM开发工程师指南， RAG 本文字数： 479 阅读时长 ≈ 1 分钟

检索是 RAG 的核心，提供了准确的上下文才能正确输出答案，如果提供无关甚至错误的上下文，那么将得到错误答案

发表于 2025-01-22 更新于 2025-02-02 分类于 2-深度学习， LLM开发工程师指南， RAG 本文字数： 2.6k 阅读时长 ≈ 2 分钟

检索过程非常依赖用户输入，在使用 “用户提问” 按照索引的方式去检索文档时，需要对 “用户提问” 先加工，主要包括重写和扩展等，以便提高检索的准确性

发表于 2025-01-22 更新于 2025-02-02 分类于 2-深度学习， LLM开发工程师指南， RAG 本文字数： 737 阅读时长 ≈ 1 分钟

数据提取的目的是从文本或者非文本的文件中提取文本，难点在于非文本文件的处理，如：PDF、xlsx 等文件，包括文件内部的表格、图片的处理

发表于 2025-01-22 更新于 2025-02-02 分类于 2-深度学习， LLM开发工程师指南， RAG 本文字数： 892 阅读时长 ≈ 1 分钟

索引是构建原始文本块的另一种表示方式，以便在后续能通过该表示方式快速检索到相关上下文

发表于 2025-01-22 更新于 2025-02-02 分类于 2-深度学习， LLM开发工程师指南， RAG 本文字数： 843 阅读时长 ≈ 1 分钟

在构建 RAG 应用时，提前对接入的知识进行预处理，能减轻检索的压力，提升回答的准确度

发表于 2025-01-22 更新于 2025-02-02 分类于 2-深度学习， LLM开发工程师指南， RAG 本文字数： 614 阅读时长 ≈ 1 分钟

RAG (Retrieval-Augmented Generation) 又称检索增强生成，通过外部知识改善 llm 的幻觉、即时性和专业性

发表于 2025-01-22 更新于 2025-02-07 分类于 2-深度学习， LLM开发工程师指南， RAG 本文字数： 1.3k 阅读时长 ≈ 1 分钟

RAG 的早期主要包括：索引、检索、生成阶段，也被称为 Naive RAG

发表于 2025-01-21 更新于 2025-02-02 分类于 2-深度学习， LLM开发工程师指南， RAG 本文字数： 3.9k 阅读时长 ≈ 4 分钟

在文章利用 langchian 搭建通用的表格数据分析工具 | 年轻人起来冲中，我们针对 RAG 回答统计、分析类问题的能力弱的问题，我们通过对问题分类，使用生成 pandas 代码的方式完成回答。但是这个方式存在一个问题，即无法处理多个表格，本文扩展使用场景，将其扩展到可以使用多表格的领域

发表于 2025-01-21 更新于 2025-02-02 分类于 4-系统软件， E-docker 本文字数： 2.5k 阅读时长 ≈ 2 分钟

本文记录在 linux 安装 docker，并进行配置

发表于 2025-01-19 更新于 2025-02-02 分类于 4-系统软件， B-Hexo 本文字数： 2.9k 阅读时长 ≈ 3 分钟

在 github page 使用构建的网站，访问速度慢，并且国内无法检索到，因此为了后续备案网站的需求，计划将 hexo 部署到腾讯云