Agent智能体经典范式构建指南:ReAct、Plan-and-Solve 与 Reflection 全面解析

前言

2025年以来,大模型领域最热门的话题之一,无疑是 Agent(智能体)

从 ChatGPT 的 Deep Research,到 Claude Code、OpenManus、AutoGen、CrewAI,再到各种自动化办公助手和编程助手,Agent 正逐渐从“会聊天的大模型”演变成“能够自主完成任务的数字员工”。

很多刚接触 Agent 的同学会发现:

为什么有的 Agent 会先思考再行动?

为什么有的 Agent 能自己制定计划?

为什么有的 Agent 完成任务后还会反思并修改答案?

事实上,这些能力背后对应着 Agent 领域最经典的三种设计范式:

  • ReAct(Reason + Act)
  • Plan-and-Solve(规划求解)
  • Reflection(反思优化)

本文将带你系统了解这三种经典 Agent 架构,并分析它们的适用场景、优缺点以及演化关系。


Agent到底是什么?

传统大模型工作流程:

用户提问
   ↓
LLM推理
   ↓
输出答案

Agent工作流程:

用户提问
   ↓
任务理解
   ↓
规划
   ↓
工具调用
   ↓
执行
   ↓
结果验证
   ↓
最终输出

核心区别在于:

Agent不仅会思考,还会行动。

例如:

用户输入:

帮我分析最近一周AI领域的重要新闻,
并整理成一份PPT。

普通LLM:

给出一些新闻摘要

Agent:

搜索新闻
↓
筛选重要内容
↓
总结归纳
↓
生成PPT
↓
返回下载链接

而 ReAct、Plan-and-Solve、Reflection 就是 Agent 完成任务时最经典的三种思维模式。


第一种范式:ReAct

什么是ReAct?

ReAct 全称:

Reason + Act
推理 + 行动

由 Google Research 于2022年提出。

核心思想:

一边思考,一边行动。

不像传统 Chain of Thought 一次性推理到底,而是:

思考
↓
执行
↓
观察结果
↓
继续思考
↓
继续执行

形成循环。


ReAct工作流程

Question
    ↓
Thought
    ↓
Action
    ↓
Observation
    ↓
Thought
    ↓
Action
    ↓
Observation
    ↓
Final Answer

示例

用户:

《流浪地球2》的导演是谁?

Agent执行:

Step1

Thought:
我需要查询电影信息

Step2

Action:
搜索《流浪地球2》

Step3

Observation:
导演:郭帆

Step4

Final Answer:
导演是郭帆

ReAct Prompt模板

Question: 用户问题

Thought:
我应该怎么做?

Action:
调用什么工具?

Observation:
工具返回结果

Thought:
下一步做什么?

Final Answer:
最终答案

优点

实时决策

能够根据工具返回结果动态调整。

实现简单

目前绝大多数Agent框架默认支持。

例如:

  • LangChain Agent
  • CrewAI
  • AutoGen
  • OpenManus

本质都是ReAct思想。


缺点

缺乏全局规划

例如:

写一本书
完成一个项目
分析一个大型代码库

Agent可能走一步看一步。

容易:

任务漂移
重复执行
效率低

第二种范式:Plan-and-Solve

为什么出现?

研究人员发现:

ReAct虽然灵活,

但面对复杂任务时:

先干再说

容易导致路径混乱。

于是提出:

先规划
后执行

即:

Plan-and-Solve。


核心思想

第一阶段:

Plan
制定完整计划

第二阶段:

Solve
按照计划执行

工作流程

Task
 ↓
Planner
 ↓
生成任务计划
 ↓
Step1
 ↓
Step2
 ↓
Step3
 ↓
...
 ↓
Final Answer

示例

用户:

帮我写一篇Agent技术调研报告

Agent首先规划:

步骤1:
介绍Agent概念

步骤2:
分析主流框架

步骤3:
分析应用场景

步骤4:
总结未来趋势

然后逐步执行。


Prompt模板

请先分析任务,
生成完整执行计划。

然后严格按照计划逐步完成任务。

优点

全局视角

不会想到哪做到哪。

更适合复杂任务

例如:

  • 项目开发
  • 长文写作
  • 学术研究
  • 软件工程

缺点

计划可能错误

如果第一步规划错了:

后面全部跟着错

灵活性不足

执行过程中难以动态调整。


第三种范式:Reflection

什么是Reflection?

Reflection:

反思机制

核心思想:

完成任务后,再检查自己。

类似人类:

做题
↓
检查
↓
发现错误
↓
修改

工作流程

Task
 ↓
生成答案
 ↓
Critic
 ↓
发现问题
 ↓
修正答案
 ↓
再次检查
 ↓
最终结果

示例

用户:

计算:
378 × 49

Agent:

第一次回答

18522

Reflection阶段

检查计算过程
发现错误

修正

378 × 49
=18522

结果正确

如果发现错误则继续修正。


Reflection Prompt模板

请先完成任务。

然后以审稿人身份审查答案。

指出问题。

重新优化答案。

输出最终结果。

优点

提高准确率

显著减少:

  • 幻觉
  • 逻辑错误
  • 数学错误

提升代码质量

在 Claude Code、Cursor 等工具中广泛应用。

典型流程:

写代码
↓
运行测试
↓
分析报错
↓
修复代码
↓
重新测试

本质就是Reflection。


缺点

Token消耗高

一次任务可能执行:

生成
↓
反思
↓
重写

成本翻倍。


三种范式对比

维度 ReAct Plan-and-Solve Reflection
核心思想 边想边做 先规划后执行 先完成再反思
灵活性
准确率 中高
成本
复杂任务能力
工具调用
典型场景 搜索问答 项目规划 代码优化

当前主流Agent的做法

现实中的先进Agent很少只采用一种范式。

通常会融合:

Plan-and-Solve
        ↓
ReAct执行
        ↓
Reflection复盘

形成:

规划
 ↓
执行
 ↓
反思
 ↓
修正

闭环架构。

例如:

Claude Code

Plan
↓
编码
↓
测试
↓
Reflection
↓
修复

OpenManus

Plan
↓
ReAct执行
↓
工具调用
↓
Reflection优化

Deep Research

规划调研
↓
搜索资料
↓
交叉验证
↓
反思补充
↓
输出报告

Agent未来的发展趋势

当前Agent正在从单智能体向多智能体演化。

未来可能出现:

Multi-Agent

多个Agent协同工作。

例如:

产品经理Agent
↓
架构师Agent
↓
开发Agent
↓
测试Agent

共同完成项目。


Self-Evolving Agent

自我进化Agent。

能够:

自动发现问题
自动学习经验
自动优化Prompt

Agent Operating System

Agent操作系统。

未来可能出现:

Agent版Windows
Agent版Linux

用户只需提出需求,

Agent自动完成所有操作。


总结

如果用一句话概括三种经典Agent范式:

ReAct:
边思考边行动

Plan-and-Solve:
先规划再行动

Reflection:
先完成再反思

它们分别解决了 Agent 的三个核心问题:

ReAct:
如何行动

Plan-and-Solve:
如何规划

Reflection:
如何改进

而当前最先进的 Agent 系统,往往采用三者融合的方式:

Plan
 ↓
ReAct
 ↓
Reflection

这也是今天大多数 AI Agent 产品背后的核心架构思路。

Logo

Agent 垂直技术社区,欢迎活跃、内容共建。

更多推荐