Agent智能体经典范式构建指南：ReAct、Plan-and-Solve 与 Reflection 全面解析

weixin_52201538

155人浏览 · 2026-06-10 17:40:18

weixin_52201538 · 2026-06-10 17:40:18 发布

Agent智能体经典范式构建指南：ReAct、Plan-and-Solve 与 Reflection 全面解析

前言

2025年以来，大模型领域最热门的话题之一，无疑是 Agent（智能体）。

从 ChatGPT 的 Deep Research，到 Claude Code、OpenManus、AutoGen、CrewAI，再到各种自动化办公助手和编程助手，Agent 正逐渐从“会聊天的大模型”演变成“能够自主完成任务的数字员工”。

很多刚接触 Agent 的同学会发现：

为什么有的 Agent 会先思考再行动？

为什么有的 Agent 能自己制定计划？

为什么有的 Agent 完成任务后还会反思并修改答案？

事实上，这些能力背后对应着 Agent 领域最经典的三种设计范式：

ReAct（Reason + Act）
Plan-and-Solve（规划求解）
Reflection（反思优化）

本文将带你系统了解这三种经典 Agent 架构，并分析它们的适用场景、优缺点以及演化关系。

Agent到底是什么？

传统大模型工作流程：

用户提问
   ↓
LLM推理
   ↓
输出答案

Agent工作流程：

用户提问
   ↓
任务理解
   ↓
规划
   ↓
工具调用
   ↓
执行
   ↓
结果验证
   ↓
最终输出

核心区别在于：

Agent不仅会思考，还会行动。

例如：

用户输入：

帮我分析最近一周AI领域的重要新闻，
并整理成一份PPT。

普通LLM：

给出一些新闻摘要

Agent：

搜索新闻
↓
筛选重要内容
↓
总结归纳
↓
生成PPT
↓
返回下载链接

而 ReAct、Plan-and-Solve、Reflection 就是 Agent 完成任务时最经典的三种思维模式。

第一种范式：ReAct

什么是ReAct？

ReAct 全称：

Reason + Act
推理 + 行动

由 Google Research 于2022年提出。

核心思想：

一边思考，一边行动。

不像传统 Chain of Thought 一次性推理到底，而是：

思考
↓
执行
↓
观察结果
↓
继续思考
↓
继续执行

形成循环。

ReAct工作流程

Question
    ↓
Thought
    ↓
Action
    ↓
Observation
    ↓
Thought
    ↓
Action
    ↓
Observation
    ↓
Final Answer

示例

用户：

《流浪地球2》的导演是谁？

Agent执行：

Step1

Thought:
我需要查询电影信息

Step2

Action:
搜索《流浪地球2》

Step3

Observation:
导演：郭帆

Step4

Final Answer:
导演是郭帆

ReAct Prompt模板

Question: 用户问题

Thought:
我应该怎么做？

Action:
调用什么工具？

Observation:
工具返回结果

Thought:
下一步做什么？

Final Answer:
最终答案

优点

实时决策

能够根据工具返回结果动态调整。

实现简单

目前绝大多数Agent框架默认支持。

例如：

LangChain Agent
CrewAI
AutoGen
OpenManus

本质都是ReAct思想。

缺点

缺乏全局规划

例如：

写一本书
完成一个项目
分析一个大型代码库

Agent可能走一步看一步。

容易：

任务漂移
重复执行
效率低

第二种范式：Plan-and-Solve

为什么出现？

研究人员发现：

ReAct虽然灵活，

但面对复杂任务时：

先干再说

容易导致路径混乱。

于是提出：

先规划
后执行

即：

Plan-and-Solve。

核心思想

第一阶段：

Plan
制定完整计划

第二阶段：

Solve
按照计划执行

工作流程

Task
 ↓
Planner
 ↓
生成任务计划
 ↓
Step1
 ↓
Step2
 ↓
Step3
 ↓
...
 ↓
Final Answer

示例

用户：

帮我写一篇Agent技术调研报告

Agent首先规划：

步骤1：
介绍Agent概念

步骤2：
分析主流框架

步骤3：
分析应用场景

步骤4：
总结未来趋势

然后逐步执行。

Prompt模板

请先分析任务，
生成完整执行计划。

然后严格按照计划逐步完成任务。

优点

全局视角

不会想到哪做到哪。

更适合复杂任务

例如：

项目开发
长文写作
学术研究
软件工程

缺点

计划可能错误

如果第一步规划错了：

后面全部跟着错

灵活性不足

执行过程中难以动态调整。

第三种范式：Reflection

什么是Reflection？

Reflection：

反思机制

核心思想：

完成任务后，再检查自己。

类似人类：

做题
↓
检查
↓
发现错误
↓
修改

工作流程

Task
 ↓
生成答案
 ↓
Critic
 ↓
发现问题
 ↓
修正答案
 ↓
再次检查
 ↓
最终结果

示例

用户：

计算：
378 × 49

Agent：

第一次回答

Reflection阶段

检查计算过程
发现错误

修正

378 × 49
=18522

结果正确

如果发现错误则继续修正。

Reflection Prompt模板

请先完成任务。

然后以审稿人身份审查答案。

指出问题。

重新优化答案。

输出最终结果。

优点

提高准确率

显著减少：

幻觉
逻辑错误
数学错误

提升代码质量

在 Claude Code、Cursor 等工具中广泛应用。

典型流程：

写代码
↓
运行测试
↓
分析报错
↓
修复代码
↓
重新测试

本质就是Reflection。

缺点

Token消耗高

一次任务可能执行：

生成
↓
反思
↓
重写

成本翻倍。

三种范式对比

维度	ReAct	Plan-and-Solve	Reflection
核心思想	边想边做	先规划后执行	先完成再反思
灵活性	高	中	中
准确率	中	中高	高
成本	低	中	高
复杂任务能力	中	高	高
工具调用	强	中	中
典型场景	搜索问答	项目规划	代码优化

当前主流Agent的做法

现实中的先进Agent很少只采用一种范式。

通常会融合：

Plan-and-Solve
        ↓
ReAct执行
        ↓
Reflection复盘

形成：

规划
 ↓
执行
 ↓
反思
 ↓
修正

闭环架构。

例如：

Claude Code

Plan
↓
编码
↓
测试
↓
Reflection
↓
修复

OpenManus

Plan
↓
ReAct执行
↓
工具调用
↓
Reflection优化

Deep Research

规划调研
↓
搜索资料
↓
交叉验证
↓
反思补充
↓
输出报告

Agent未来的发展趋势

当前Agent正在从单智能体向多智能体演化。

未来可能出现：

Multi-Agent

多个Agent协同工作。

例如：

产品经理Agent
↓
架构师Agent
↓
开发Agent
↓
测试Agent

共同完成项目。

Self-Evolving Agent

自我进化Agent。

能够：

自动发现问题
自动学习经验
自动优化Prompt

Agent Operating System

Agent操作系统。

未来可能出现：

Agent版Windows
Agent版Linux

用户只需提出需求，

Agent自动完成所有操作。

总结

如果用一句话概括三种经典Agent范式：

ReAct：
边思考边行动

Plan-and-Solve：
先规划再行动

Reflection：
先完成再反思

它们分别解决了 Agent 的三个核心问题：

ReAct：
如何行动

Plan-and-Solve：
如何规划

Reflection：
如何改进

而当前最先进的 Agent 系统，往往采用三者融合的方式：

Plan
 ↓
ReAct
 ↓
Reflection

这也是今天大多数 AI Agent 产品背后的核心架构思路。

AI Agent技术社区

Agent 垂直技术社区，欢迎活跃、内容共建。

更多推荐

我发现 Claude Code 不是失忆，而是我没给它办入职

摘要：作者在使用Claude Code时发现，频繁重复介绍项目背景和规范导致效率低下，问题并非AI记忆缺陷，而是缺乏系统性的项目知识沉淀。通过创建CLAUDE.md文件（类似"员工手册"）记录项目定位、目录结构、开发规范等核心信息，显著降低了沟通成本。这种将散落聊天记录的项目知识集中归档的方式，使AI能更快理解上下文，实现知识积累而非重复学习。作者指出，AI工具的价值不仅在于代码能力，更在于如何