顶级AI Agent设计模式

文章讨论了AI模型，特别是大型语言模型（LLMs）如GPT，如何通过采用类似人类迭代问题解决的代理工作流程来自主学习。代理工作流程通过逐步细化任务来提高AI性能，类似于人类反复审查和改进他们的工作以获得更好的结果。介绍了四种关键代理设计模式——反思、工具使用、规划和多代理协作——作为使AI系统更加自主和有能力的策略。代理设计模式被引入作为使LLMs更加自主的解决方案。与其只给模型一个提示并期望得到

程序员笑武

1017人浏览 · 2025-02-02 10:45:00

程序员笑武 · 2025-02-02 10:45:00 发布

学习是一个持续的过程，无论你是人类还是人工智能模型。然而，一个经常出现的问题是，这些人工智能模型能否像人类一样自主学习？根据最近的发展——它们可以。为了更好地理解这一点，让我们回到大学时代，那时C++、Java和Python是我们为了在计算机科学领域脱颖而出而需要掌握的主要语言。学习这些语言需要理解语法、语义、实际应用和问题解决。因此，为了牢固掌握这些语言，我们不断地练习（或者说接受训练）。此外，我们还从同学和教授那里学到了很多。对吧？同样地，就像人类可以从自己的思考、专业知识和其他媒介中学习一样，也许大型语言模型也可以。

然而，对于人类和大型语言模型（LLMs）来说，获得专业知识或成为某个领域的专家是一项相当艰难的旅程。我们了解人类的学习过程和推理能力，以及如何做出决策和完成任务，但LLM的训练过程是什么样的呢？

我可以这么说：

首先，LLM的预训练：在这个步骤中，你帮助模型学习模式，例如语法、句子结构和甚至词与概念之间的关系。
指令微调（或微调）：为了微调模型，使用一个包含指令和期望响应示例的精选数据集。
带有人类反馈的强化学习（RLHF）：人类评估者对模型响应进行排名，这进一步用于提高模型与用户期望的匹配度。
这听起来有道理，对吧？但如果我们构建一个具有代理工作流程，使模型在独立进行检查的同时学习和输出结果，会怎样呢？这就像拥有一个可以独立完成所有工作的个人助理。进一步地，在这篇文章中，我们将讨论4种代理AI设计模式，用于构建AI系统。

概述

文章讨论了AI模型，特别是大型语言模型（LLMs）如GPT，如何通过采用类似人类迭代问题解决的代理工作流程来自主学习。

代理工作流程通过逐步细化任务来提高AI性能，类似于人类反复审查和改进他们的工作以获得更好的结果。
介绍了四种关键代理设计模式——反思、工具使用、规划和多代理协作——作为使AI系统更加自主和有能力的策略。

什么是代理设计模式？

代理设计模式被引入作为使LLMs更加自主的解决方案。与其只给模型一个提示并期望得到一个最终答案（比如一次性写一篇论文），代理式方法涉及多次、分步骤地提示LLM。每一步都细化任务，模型通过迭代改进其输出。

为了更好地理解这一点，让我们这样看：

当我们以零样本模式提示LLM时，就像要求某人一次性写一个故事而不进行修改。LLMs在这方面做得很好，但它们可以做得更好。通过使用代理式工作流程，我们可以分步骤多次提示LLM。每一步都建立在上一步的基础上，细化响应。想象一下，要求LLM多次审阅论文，并在每次通过中改进它。

通过每一步，我的意思是：

让我们以使用代理工作流程编写代码为例：

制定代码大纲：将任务分解成更小的模块或函数。
收集信息和内容：研究库、算法或现有解决方案。如有必要，进行网络搜索或检查文档。
编写代码的第一稿：实现基本功能，重点在结构而非完美。
审查代码以查找低效或错误：检查不必要的代码、错误或逻辑缺陷。
修改代码：重构、优化或添加注释以提高清晰度。
重复以上步骤，直到代码高效且干净。

通过允许模型独立完成这些步骤，代理设计模式增强了类似人类的推理和效率。这类似于人类如何分解复杂任务、收集信息、进行改进并迭代，直到最终结果令人满意。现在，让我们详细了解代理设计模式。

安德鲁·吴在Deeplearning.ai的一封信中分享的分析指出，AI驱动的代码生成取得了进展，尤其是关注了GPT-3.5和GPT-4等模型的表现。评估集中在这些模型在广泛认可的HumanEval编码基准上的表现，这是评估算法编写代码熟练程度的共同标准。

呈现的数据显示了使用AI代理的AI编码能力的演变。GPT-3.5在零样本设置（即没有任何先前的例子）下进行测试时，实现了48.1%的正确率。GPT-4也以零样本的方式进行评估，展示了显著的改进，成功率达到67.0%。然而，分析中引人注目的是，将这些模型整合到迭代代理工作流程（Agentic工作流程）中如何极大地提高了它们的性能。当GPT-3.5被封装在这样的代理循环中时，其准确率飙升到令人印象深刻的95.1%，远超其基线，甚至接近人类级别的编码熟练度。

这一发现强调了迭代工作流程（Agentic工作流程）在提高AI模型性能方面的变革潜力，表明AI辅助编码的未来可能更多地依赖于这些更高级、更自适应的框架，而不仅仅是模型大小或架构的改进。

但什么是Agentic设计模式，它完成了将自主权委托给AI系统的过程，使它们能够更加独立和有效地行动？这些模式结构化AI代理以更类似于人类和自主的方式执行任务、做出决策以及与其他系统通信，最终创造出既聪明又可靠的应用。

必须了解的4种Agentic设计模式
在Agentic AI和关键设计模式中，了解每种模式如何赋予大型语言模型（LLMs）如GPT以更自主和有效的行为至关重要。这些设计模式通过鼓励自我评估、工具集成、战略思考和协作，推动了AI所能做到的边界。让我们探索四种关键的Agentic设计模式，这些模式塑造了这些模型的运作方式和执行复杂任务的能力。

以下是Agentic设计模式的类型：

反思模式

反思模式专注于提升人工智能评估和改进自身输出的能力。想象一下，一个大型语言模型像人类审稿人一样审查它生成的内容或代码，识别错误、漏洞或需要改进的领域，然后提出改进建议。

这个自我批评的循环不仅限于一次迭代。AI可以根据需要重复反思过程，以达到精炼、完善的结果。例如，如果被要求编写软件，LLM可以生成一个初始版本，批评其逻辑和结构，然后修改代码。反思的迭代性质随着时间的推移会导致更强大、更可靠的输出。

这种模式在需要精确性的任务中特别有用，例如内容创作、问题解决或代码生成。采用这种方法可以通过自我引导的修正来提高模型的准确性和可靠性。

一个有趣的例子是自我反思RAG。SELF-RAG是一个框架，旨在通过将检索和自我反思整合到文本生成过程中来提高语言模型的质量和事实准确性。传统的检索增强生成（RAG）模型通过结合相关检索段落来增强响应，但通常无论相关性如何，都会检索固定数量的文档，这可能会引入噪音或不相关的内容。SELF-RAG通过一种自适应方法解决了这些限制，该方法按需检索信息，并使用反思令牌来评估生成的质量。

SELF-RAG如何使用反思？

SELF-RAG通过“反思令牌”整合自我反思机制，这些令牌用于评估文本生成的各个方面，如相关性、支持和整体效用。在生成过程中，模型评估检索是否必要，并通过在不同阶段自我批评来评估生成内容的质量。

以下图表有助于更好地理解：

传统RAG首先检索固定数量的文档，而Self-RAG则根据生成的内容动态地执行检索。Self-RAG评估多个生成的段落，对其质量进行评论，并选择性地结合最准确的信息。Self-RAG的迭代过程使得生成步骤逐步优化，提高了输出的准确性和相关性。简而言之，Self-RAG增加了一个额外的自我反思和精炼层，从而得到更可靠和精确的答案。
工具使用模式

工具使用模式通过允许LLM与外部工具和资源交互来显著扩展其能力，从而增强其解决问题的能力。遵循这种模式的AI不再仅仅依赖于内部计算或知识，而是可以访问数据库、在网络上搜索，甚至通过Python等编程语言执行复杂的功能。

例如，LLM可以被提示从网络上检索特定查询的数据，分析它并将其整合到其输出中。或者，它可能被要求计算统计结果、生成图像或操作电子表格——这些操作超出了简单的文本生成。通过使用工具，LLM从静态的知识库演变为动态的代理，能够与外部系统交互以实现目标。

这种模式之所以强大，是因为它允许AI系统处理更复杂、多方面的任务，而仅靠内部知识是不够的，将其实用性扩展到现实世界应用中。

规划模式

规划模式使LLM能够将大型、复杂的任务分解成更小、更易于管理的组件。规划使代理具备了响应请求并战略性地构建实现目标所需步骤的能力。

使用规划模式而不是线性、临时地处理问题，LLM将创建一个子任务的路线图，确定完成的最有效路径。例如，在编码时，LLM会首先概述整体结构，然后再实现单个函数。这避免了混乱或逻辑的偏差，并使AI专注于主要目标。

ReAct（推理与行动）和ReWOO（使用开放本体推理）通过将决策和上下文推理整合到规划过程中进一步扩展了这种方法。ReAct使LLM能够动态地在推理（思考问题）和行动（执行特定任务）之间交替，从而实现更适应性和灵活的规划。通过结合这两个步骤，LLM可以迭代地优化其方法，应对出现的意外挑战。

另一方面，ReWOO通过使用开放世界的本体来引导推理，增强了规划模式。这意味着LLM可以结合更广泛的上下文信息和来自各个领域的知识，从而实现更明智的决策。通过ReWOO，AI可以根据新获得的信息或变化的需求实时调整计划，确保更稳健和全面的解决问题的方法。

总之，规划模式、ReAct和ReWOO使LLM能够以结构化且适应性的方式处理复杂任务，从而实现高效和目标导向的执行。

此外，生成结构化计划（或“用户请求摘要”）确保AI跟踪所有步骤，不会失去对更广泛任务的视野。这种方法确保了结果的质量和一致性，尤其是在复杂问题解决或多阶段项目中。

多代理模式

多代理模式建立在委托的概念之上，类似于人类团队中的项目管理。这种模式涉及分配不同的代理（即具有特定角色或功能的LLM实例）来处理各种子任务。这些代理可以独立完成其任务，同时相互沟通和协作，以实现统一的结果。

多代理模式有多种类型：

协作代理：多个代理共同处理任务的不同部分，共享进度并朝着统一的结果努力。每个代理可能专注于不同的领域。
监督代理：一个中央监督代理管理其他代理，协调其活动并验证结果以确保质量。
分层团队：一个结构化的系统，其中高级代理监督低级代理，决策通过层级传递以完成复杂任务。
更多详情请参阅：多代理协作。

例如，在一个需要文本分析和数值计算的场景中，两个单独的代理可以处理每个任务，共享其结果以形成一个全面的解决方案。一个代理可能专注于理解上下文，而另一个处理数据，他们共同提供全面的响应。这种模式特别适用于处理需要多种技能的大型或复杂问题。

简而言之，多代理模式反映了人类在不同专业领域之间协作的方式，确保每个代理专注于其优势，同时为更大的、协调一致的努力做出贡献。

通过掌握这四种代理设计模式，开发人员和用户都可以解锁AI系统的全部潜力。反思模式通过自我评估提高了准确性和质量，工具使用使动态的、现实世界的交互成为可能，规划为解决复杂任务提供了路线图，而多代理协作确保了多个代理有效地协作。这些模式共同为构建更智能、自主的AI系统奠定了基础，这些系统能够应对现实世界的挑战。

结论

代理设计模式强调了代理工作流程在使AI模型，特别是大型语言模型（LLM）更自主和高效方面的变革潜力。它解释说，虽然GPT-3.5和GPT-4在零样本任务上表现良好，但它们的准确性和有效性在采用迭代、代理工作流程时显著提高。这种方法允许模型分解任务、自我评估、利用外部工具、战略规划以及与其他代理协作，增强其解决问题的能力。

本文介绍了四个关键设计模式——反思、工具使用、规划和多代理——这些模式构成了这些代理工作流程的基础。这些模式推动了AI所能做的事情的边界，并使AI系统能够更独立、更智能地行动，就像人类处理复杂任务一样。这表明未来的AI进步将取决于模型尺寸的增加以及更适应性和战略工作流程的发展。

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述