【01】AI Agent 到底是什么？从 Chatbot 到 Agent 的本质跨越

梁子应该没事吧 · 2026-06-29 17:19:08 发布

AI Agent 到底是什么？从 Chatbot 到 Agent 的本质跨越

基于 Lion-1209/AgentStudy 仓库，对应代码见 stage1-fundamentals/

你最近可能频繁看到这三个词，但它们到底是什么意思？

简单说：LLM 是大脑，Harness 是骨架，Agent 是完整的"人"。

LLM = Large Language Model，大语言模型。

就是大家熟悉的 ChatGPT、Claude、DeepSeek、通义千问这些东西。

它们能做什么？读文字、写文字、回答问题、写代码。 本质上是一个"超级文本补全器"——你给它一段文字，它预测接下来最可能出现的文字。

但 LLM 有一个致命限制：它不能做事。 它只能写文字，不能查天气、不能算数学题、不能操作数据库。

你问它"北京今天多少度"，它可能会编造一个数字，而不是真的去查。这个限制，催生了 Agent。

Harness 在 Agent 语境下，就是"让 LLM 变成 Agent 的工具"。

你可以把它理解成" harness = 框架 + 工具库 + 运行时"。

常见的 Harness：

Harness 本身不是 Agent。它是用来搭建 Agent 的"建材"。

Agent = 能用 LLM + Harness 自主完成任务的系统。

它有三个关键特征：

想象你去了一家餐厅：

接待员就是 Agent。 他没有一次性回答你，而是反复调用各种资源，直到你满意。

而 LLM 就像一个只会说话的客服——它能说会道，但不能真的帮你订座位。

理解了上面三个词，再来看 Agent 的四要素就顺了：