在介绍Agentic Workflow之前,先考虑一个问题

“为什么需要AI Agent/Agentic Workflow?”

目前,对于ChatGPT、文心一言、Kimi等大语言模型的使用,大多数人仍然是用简单的语句直接提问(一部分原因在于不会写结构化提示词),比如:帮我写一篇关于Agentic AI的文章。这种提问方式,在技术领域叫作零样本提示。

工业界著名人工智能专家高留云告诉我们,“零样本提示(zero-shot prompting)是指LLM模型在没有针对具体任务进行专门训练的情况下,仅依赖于提示词(prompt)和预训练中获得的广泛语言知识来执行任务的能力,它可以很好地检验大语言模型的能力。” 

这种方法灵活性高、适用范围广,且无需为每个特定任务准备专门的训练数据。但由于缺乏特定任务的训练,其生成质量无法保证。

具体到用户与大语言模型的交互,如果用户让ChatGPT写一篇关于XX的论文,ChatGPT会一次性给出回复。在这个过程中,它只会执行“生成”这个任务。

这个过程,与真实世界完成工作任务的流程是不同的。比如写论文时,一般会先起草一个初稿,再进行评估、分析、修订,迭代出第二、第三个版本,直到满意为止。我们处理工作、学习等任务时都是这样,会将其分解为按步执行的流程并按照流程来操作,以保证工作的完成的质量。

▲ 零样本提示与Agentic Workflow的区别 来源:吴恩达教授红杉峰会分享

也就是说,想要让大语言模型更出色的完成我们的交给它的工作,最好也使用类似人类的分部执行的流程步骤。

资深人工智能专家高留云告诉我们,AI Agent就是来做这个工作的,它能通过自然语言了解用户所输入零样本提示词的意图,并将这个用户给定的需求目标任务规划分解为多个流程步骤,将简单的提示词转化为更精细的机构化提示词,并可以调用联网、代码等各种工具插件去进一步执行并完成所分解的各种子任务。

显然,这样的工作方式已经无限接近于人类。

Zero-shot prompting模式和AI Agent模式的任务执行效果,非常明显。吴恩达教授团队分别以“Zero-shot prompting”模式和AI Agent模式使用GPT-3.5和GPT-4,得出了几个结论:

1、Zero-shot模式下,模型在没有具体任务示例的情况下,仅依赖于其预训练的知识来执行任务。这种情况下比拼的是模型的通用基础能力,所以GPT-4得表现好在意料之中。

2、添加了Agentic Workflow的AI Agent在任务执行中的表现显著提升,不论基座模型是GPT-3.5还是GPT-4。

3、即使基座模型是GPT-3.5,通过添加Agentic Workflow将其设计为AI Agent后,性能表现也超过了Zero-shot模式下的GPT-4。

吴恩达教授还总结和介绍了四种较为常见的设计模式,分别是反馈(Reflection)、工具使用(Tool Use)、规划(Planning)和多智能体协作(Multi-agent Collaboration)。

反馈(Reflection)设计模式是一种让AI模型通过自我反思和迭代改进来提高任务执行能力的方法。在这种模式中,模型不仅生成初始解决方案,还会通过多次反馈和修改,不断优化其输出。

工具使用(Tool Use)设计模式是一种让AI模型通过调用外部工具或库来增强任务执行能力的方法。在这种模式中,模型并不仅仅依赖于自身的知识和能力,而是利用各种外部资源来完成任务,从而提高效率和准确性。

规划(Planning)设计模式是一种通过提前计划和组织任务步骤来提高效率和准确性的方法。在这种模式中,模型将复杂任务分解为多个步骤,并依次执行每个步骤,以达到预期的目标。

多智能体协作(Multiagent Collaboration)设计模式是一种通过多个智能体之间的合作来提高任务执行效率和准确性的方法。在这种模式中,多个智能体分担任务,并通过相互交流和协作,共同完成复杂任务。

PS:以上标有 Andrew Ng的图片,都来自吴恩达教授红杉峰会分享。

AI Agent/Agentic Workflow可以更好帮助用户与大语言模型交互,帮助用户更好的完成各种任务。这将极大地拓展AI的使用场景,有效地提高任务完成质量,因此对AI应用的落地至关重要。

在这个分享中,吴恩达教授将Agent参与的流程称作Agentic Workflow,而不是AI Agent workflow,显然后者更注重AI Agent参与的workflow而不是AI Agent本身。从这一点,也能看出AI Agent与 Agentic AI的简单区别。著名人工智能专家高留云补充道,吴恩达教授的观点更注重理论先行,而现实的工业界更注重落地和实际执行效果,所以从应用层面,大家关注AI Agent的打造即可。不要太较真概念和术语的区分。很明显,Agent智能体可以显著提升大模型应用效果。

对于AI Agent参与的业务流程自动化,RPA\超自动化、ERP、CRM、BI等技术厂商早已在现有技术生态下引入了AI Agent架构,且表现出的任务执行能力更强。曾经在IBM,百度等企业有过10多年AI行业实践的资深人工智能专家高留云补充道:“随之AI Agent的不断普及,过去的RPA一定会被新的范式所颠覆,很多RPA厂家已经在这么做了。或者说,有了AI Agent还需不需要RPA的存在,大家可以留心观察,RPA领域怎么变化。技术变化太快了,企业和个人投资除了注重ROI,也一定要紧跟趋势。”

Agentic AI的概念已经讲清楚,而后面要实现这个目标并使其繁荣,就要看各种AI Agent的构建方式以及各种融合AI Agent的Agentic Workflow解决方案了。

在Agentic Workflow的构建方面,吴恩达教授给出的四种主流设计模式,已经给于开发者及企业很大启发。资深人工智能专家高留云表示,他们服务的客户已经在尝试通过这几种模式的结合大幅提升大模型的应用效果。尤其是在一些复杂应用的场景下,AI应用效果的提升非常显著。事实上,从大概2016年,他还在IBM任职时,他服务的一些客户已经太探讨通过类似的技术来提升AI的效果了。

目前很多AI Agent构建平台已经支持这四种设计模式,企业及个人都已能在这些平台构建符合需求Agentic Workflow。还有很多开源项目也在进一步优化Agentic workflow的构建流程,对于广大组织的私有化部署都是极大的利好。

此外很多技术供应商也已在引入AI Agent的基础上进一步构建Agentic Workflow,能够让用户更简单快捷的应用各种智能工作流。

Logo

更多推荐