评估生成的结果可能很困难,因为与传统机器学习不同,预测结果不是一个数字,并且很难为此问题定义定量指标

LlamaIndex 提供基于 LLM 的评估模块来衡量结果的质量。它使用 “黄金” LLM(例如 GPT-4)来确定预测答案是否以各种方式正确

阅读全文 »

工作流是结合一个或多个代理、数据连接器和其他工具来完成任务的多步骤流程。它们是事件驱动型软件,允许您将 RAG 数据源和多个代理组合在一起,以创建一个复杂的应用程序,该应用程序可以通过反射、纠错和高级 LLM 应用程序的其他特征来执行各种任务

阅读全文 »