cover

探索RAG与Multi-Agent的结合：解决复杂任务的新方法

RAG，全称Retrieval-Augmented Generation，是一种辅助AI语言模型生成基于外部信息文本的方法。在RAG中，我们将数据拆分成多个小块，然后将这些小块嵌入到低维空间并存储在向量存储中。当用户提出查询时，该查询也会嵌入到相同的低维空间，与向量存储中的信息进行比较，从而检索到相关的信息作为上下文，并与查询一起输入到语言模型中，生成基于上下文的最终答案。智能代理是先进的AI系统

Python程序员罗宾

1184人浏览 · 2024-12-11 16:26:08

Python程序员罗宾 · 2024-12-11 16:26:08 发布

最近帮企业定制了一个langgraph+rag的项目，跟大家简单介绍一下设计架构和具体的应用。如果大家有兴趣，我也可以出一期视频，给大家详细介绍一下。我们会一步步探讨如何构建一个可以控的Agent，以执行RAG任务，并最终展示一个简短的演示。

前排提示，文末有大模型AGI-CSDN独家资料包哦！

什么是RAG？

RAG，全称Retrieval-Augmented Generation，是一种辅助AI语言模型生成基于外部信息文本的方法。在RAG中，我们将数据拆分成多个小块，然后将这些小块嵌入到低维空间并存储在向量存储中。当用户提出查询时，该查询也会嵌入到相同的低维空间，与向量存储中的信息进行比较，从而检索到相关的信息作为上下文，并与查询一起输入到语言模型中，生成基于上下文的最终答案。

什么是Agent？

智能代理是先进的AI系统，设计用于执行需要连续推理的复杂任务。它们可以预见未来的步骤，记住过去的对话，并使用不同的工具根据情况和需求调整其响应。

为什么我们需要控制Agent？

控制智能代理的原因在于代理自主性与过程控制之间的权衡。代理的自主性越高，我们对其控制就越少。使用常规代理时，我们无法控制它何时使用工具或以何种顺序使用工具，也无法控制其得出的结论，特别是在处理其内在机制中的幻觉或预训练知识时。然而，通过构建工作流程，我们可以定义解决问题的具体路径，从而对每一步进行全面控制，但这需要量身定制的解决方案，可能耗时且复杂。

构建可控的RAG代理的基本模块

语义相似性

在我们的嵌入空间中，嵌入数据的方式使得相似的词汇彼此接近。例如，“国王”和“王后”的距离会比“狗”近。利用这种语义相似性，我们可以在简单的RAG任务中，例如历史事件查询中，检索到相关的上下文并生成答案。

处理复杂问题

对于更复杂的问题，我们需要不同的方法来构建数据。例如，我们可以使用语言模型生成章节摘要，包含关键点和章节总结，增加找到解决此类问题的可能性。

多向量存储

为了精确处理复杂问题，我们可以建立多个向量存储，例如文本块存储、章节摘要存储和书籍引用存储。

构建可控RAG代理的工作流程

我们需要以下能力：

工具：代理需要具备检索和回答问题的工具。
推理能力：构建解决问题的流程。
过程控制：确保每一步按预期进行。
终止判断：知道何时停止代理的操作。
评估任务表现：评估任务完成的效果。

Agent Tools

我们需要三种检索工具：引用检索、章节摘要检索和文本块检索。此外，还需要一种回答工具，用于在中间步骤或最终生成答案时使用已有的上下文。

问题匿名化

为了避免预训练模型的偏见，我们可以将问题中的特定实体替换为变量，例如将“关羽是如何打败华雄的？”替换为“X是如何打败Y的？”，构建一般计划后再替换回原始名称。

代理工作流程

输入问题并匿名化。
使用计划器构建匿名问题的解决步骤。
去匿名化并分解为检索或回答工具。
任务处理器选择合适的工具进行操作。
根据上下文和计划进行重新规划，直到问题解决或达到终止条件。

终止条件

我们可以通过以下方法判断何时停止：

每一步询问语言模型当前上下文是否足够回答问题。
直到新信息量低于某个阈值。
限制图的递归次数，如达到100次遍历后停止。

评估

我们可以通过以下指标评估RAG任务的效果：

答案正确性：答案是否事实正确。
忠实度：生成的答案是否基于检索的信息。
答案相关性：答案与问题的相关性。
语义相似度：生成答案与标准答案的语义相似度。

总结

通过结合RAG和智能代理，我们能够解决复杂的任务，尽管可能需要权衡时间和成本，但在解决无法通过其他方法解决的任务时，这种方法具有显著优势。

读者福利：如果大家对大模型感兴趣，这套大模型学习资料一定对你有用

对于0基础小白入门：

如果你是零基础小白，想快速入门大模型是可以考虑的。

一方面是学习时间相对较短，学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

包括：大模型学习线路汇总、学习阶段，大模型实战案例，大模型学习视频，人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型！

😝有需要的小伙伴，可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

👉AI大模型学习路线汇总👈

大模型学习路线图，整体分为7个大的阶段：（全套教程文末领取哈）

第一阶段： 从大模型系统设计入手，讲解大模型的主要方法；

第二阶段： 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用；

第三阶段： 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统；

第四阶段： 大模型知识库应用开发以LangChain框架为例，构建物流行业咨询智能问答系统；

第五阶段： 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型；

第六阶段： 以SD多模态大模型为主，搭建了文生图小程序案例；

第七阶段： 以大模型平台应用与开发为主，通过星火大模型，文心大模型等成熟大模型构建大模型行业应用。

👉大模型实战案例👈

光学理论是没用的，要学会跟着一起做，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战案例来学习。

在这里插入图片描述

👉大模型视频和PDF合集👈

观看零基础学习书籍和视频，看书籍和视频学习是最快捷也是最有效果的方式，跟着视频中老师的思路，从基础到深入，还是很容易入门的。
在这里插入图片描述

👉学会后的收获：👈

• 基于大模型全栈工程实现（前端、后端、产品经理、设计、数据分析等），通过这门课可获得不同能力；

• 能够利用大模型解决相关实际项目需求： 大数据时代，越来越多的企业和机构需要处理海量数据，利用大模型技术可以更好地处理这些数据，提高数据分析和决策的准确性。因此，掌握大模型应用开发技能，可以让程序员更好地应对实际项目需求；

• 基于大模型和企业数据AI应用开发，实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能， 学会Fine-tuning垂直训练大模型（数据准备、数据蒸馏、大模型部署）一站式掌握；

• 能够完成时下热门大模型垂直领域模型训练能力，提高程序员的编码能力： 大模型应用开发需要掌握机器学习算法、深度学习框架等技术，这些技术的掌握可以提高程序员的编码能力和分析能力，让程序员更加熟练地编写高质量的代码。

👉获取方式：

😝有需要的小伙伴，可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

AI Agent技术社区

Agent 垂直技术社区，欢迎活跃、内容共建，欢迎商务合作。wx: diudiu5555

更多推荐

cover

首款折叠iPhone或定价2300美元；百川智能两位联合创始人被曝离职；Manus启用.cn域名 | 极客头条

AI Agent技术社区

cover

开源模型应用落地-LangGraph101-ToolNode-智能工具调度的核心枢纽

AI Agent技术社区

cover

【AI落地应用实战】大模型加速器2.0：基于 ChatDoc + TextIn ParseX + ACGE的RAG知识库问答系统

AI Agent技术社区

所有评论(0)

查看更多评论

Python程序员罗宾

已为社区贡献27条内容