忘记 RAG：拥抱Agent设计，让 ChatGPT 更智能更贴近实际

本文主要是介绍忘记 RAG：拥抱Agent设计，让 ChatGPT 更智能更贴近实际，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

RAG（检索增强生成）设计模式通常用于开发特定数据领域的基于实际情况的ChatGPT。

然而，重点主要是改进检索工具的效率，如嵌入式搜索、混合搜索和微调嵌入，而不是智能搜索。

这篇文章介绍了一种新的方法，灵感来自人类研究方法，涉及多种搜索技术，观察中间结果，不断完善和重试，然后才提供回应。

通过利用智能代理设计，本文提出构建一个更智能、更扎实的ChatGPT，超越传统RAG模型的局限性。

RAG模式和限制

标准RAG模式实施概述：

该过程始于用户的问题或对话的查询创建，通常是通过提示的语言模型（LLM）完成的。这通常被称为查询重述步骤。
然后将此查询发送到搜索引擎，搜索引擎返回相关的知识（检索）。
然后，检索到的信息会通过包含用户问题的提示进行增强，并转发到LLM（增强）。
最后，LLM 对用户的查询做出了回应（生成）。

RAG的限制

在RAG模式中，检索、增强和生成由单独的流程管理。每个流程可能由具有不同提示的LLM来促进。

然而，与用户直接交互的第1001代通常最清楚如何回答用户的问题。

检索LLM可能不会像生成LLM那样解释用户意图，从而提供不必要的信息，可能会妨碍其做出回应的能力。
检索是针对每个问题执行一次，没有来自生成LLM的任何反馈循环。

如果检索结果不相关，可能是由于搜索查询或搜索词不佳等因素，生成LLM缺乏纠正的机制，可能会诉诸捏造答案。
提供的检索上下文一经确定即不可更改，也无法扩展。

例如，如果研究结果表明需要进一步调查，比如检索到一个提及需要进一步检索的文件，这方面没有规定。
RAG模式不支持多步骤研究。

智能代理模型

智能代理模型从人类研究方法中汲取灵感，当回答一个没有即时知识的问题时。在这个过程中，可能会进行一次或多次搜索，以收集有用的信息，然后提供最终答案。

每次搜索的结果都可以决定是否需要进一步调查，如果需要，还可以确定接下来搜索的方向。

这个迭代过程会持续进行，直到我们认为我们已经积累了足够的知识来回答，或者得出我们无法找到足够信息来回应的结论。

有时，研究结果可能会进一步澄清用户意图和查询范围。

为了复制这种方法，建议开发一个由语言模型（LLM）驱动的智能代理，用于与用户进行对话。

代理自主确定何时需要使用外部工具进行研究，制定一个或多个搜索查询，进行研究，审查结果，并决定是否继续进一步研究或向用户寻求澄清。

直到代理认为自己已经准备好向用户提供答案，这个过程才会持续进行。