Agent智能体经典范式构建指南:ReAct、Plan-and-Solve 与 Reflection 全面解析
Agent智能体经典范式构建指南:ReAct、Plan-and-Solve 与 Reflection 全面解析
前言
2025年以来,大模型领域最热门的话题之一,无疑是 Agent(智能体)。
从 ChatGPT 的 Deep Research,到 Claude Code、OpenManus、AutoGen、CrewAI,再到各种自动化办公助手和编程助手,Agent 正逐渐从“会聊天的大模型”演变成“能够自主完成任务的数字员工”。
很多刚接触 Agent 的同学会发现:
为什么有的 Agent 会先思考再行动?
为什么有的 Agent 能自己制定计划?
为什么有的 Agent 完成任务后还会反思并修改答案?
事实上,这些能力背后对应着 Agent 领域最经典的三种设计范式:
- ReAct(Reason + Act)
- Plan-and-Solve(规划求解)
- Reflection(反思优化)
本文将带你系统了解这三种经典 Agent 架构,并分析它们的适用场景、优缺点以及演化关系。
Agent到底是什么?
传统大模型工作流程:
用户提问
↓
LLM推理
↓
输出答案
Agent工作流程:
用户提问
↓
任务理解
↓
规划
↓
工具调用
↓
执行
↓
结果验证
↓
最终输出
核心区别在于:
Agent不仅会思考,还会行动。
例如:
用户输入:
帮我分析最近一周AI领域的重要新闻,
并整理成一份PPT。
普通LLM:
给出一些新闻摘要
Agent:
搜索新闻
↓
筛选重要内容
↓
总结归纳
↓
生成PPT
↓
返回下载链接
而 ReAct、Plan-and-Solve、Reflection 就是 Agent 完成任务时最经典的三种思维模式。
第一种范式:ReAct
什么是ReAct?
ReAct 全称:
Reason + Act
推理 + 行动
由 Google Research 于2022年提出。
核心思想:
一边思考,一边行动。
不像传统 Chain of Thought 一次性推理到底,而是:
思考
↓
执行
↓
观察结果
↓
继续思考
↓
继续执行
形成循环。
ReAct工作流程
Question
↓
Thought
↓
Action
↓
Observation
↓
Thought
↓
Action
↓
Observation
↓
Final Answer
示例
用户:
《流浪地球2》的导演是谁?
Agent执行:
Step1
Thought:
我需要查询电影信息
Step2
Action:
搜索《流浪地球2》
Step3
Observation:
导演:郭帆
Step4
Final Answer:
导演是郭帆
ReAct Prompt模板
Question: 用户问题
Thought:
我应该怎么做?
Action:
调用什么工具?
Observation:
工具返回结果
Thought:
下一步做什么?
Final Answer:
最终答案
优点
实时决策
能够根据工具返回结果动态调整。
实现简单
目前绝大多数Agent框架默认支持。
例如:
- LangChain Agent
- CrewAI
- AutoGen
- OpenManus
本质都是ReAct思想。
缺点
缺乏全局规划
例如:
写一本书
完成一个项目
分析一个大型代码库
Agent可能走一步看一步。
容易:
任务漂移
重复执行
效率低
第二种范式:Plan-and-Solve
为什么出现?
研究人员发现:
ReAct虽然灵活,
但面对复杂任务时:
先干再说
容易导致路径混乱。
于是提出:
先规划
后执行
即:
Plan-and-Solve。
核心思想
第一阶段:
Plan
制定完整计划
第二阶段:
Solve
按照计划执行
工作流程
Task
↓
Planner
↓
生成任务计划
↓
Step1
↓
Step2
↓
Step3
↓
...
↓
Final Answer
示例
用户:
帮我写一篇Agent技术调研报告
Agent首先规划:
步骤1:
介绍Agent概念
步骤2:
分析主流框架
步骤3:
分析应用场景
步骤4:
总结未来趋势
然后逐步执行。
Prompt模板
请先分析任务,
生成完整执行计划。
然后严格按照计划逐步完成任务。
优点
全局视角
不会想到哪做到哪。
更适合复杂任务
例如:
- 项目开发
- 长文写作
- 学术研究
- 软件工程
缺点
计划可能错误
如果第一步规划错了:
后面全部跟着错
灵活性不足
执行过程中难以动态调整。
第三种范式:Reflection
什么是Reflection?
Reflection:
反思机制
核心思想:
完成任务后,再检查自己。
类似人类:
做题
↓
检查
↓
发现错误
↓
修改
工作流程
Task
↓
生成答案
↓
Critic
↓
发现问题
↓
修正答案
↓
再次检查
↓
最终结果
示例
用户:
计算:
378 × 49
Agent:
第一次回答
18522
Reflection阶段
检查计算过程
发现错误
修正
378 × 49
=18522
结果正确
如果发现错误则继续修正。
Reflection Prompt模板
请先完成任务。
然后以审稿人身份审查答案。
指出问题。
重新优化答案。
输出最终结果。
优点
提高准确率
显著减少:
- 幻觉
- 逻辑错误
- 数学错误
提升代码质量
在 Claude Code、Cursor 等工具中广泛应用。
典型流程:
写代码
↓
运行测试
↓
分析报错
↓
修复代码
↓
重新测试
本质就是Reflection。
缺点
Token消耗高
一次任务可能执行:
生成
↓
反思
↓
重写
成本翻倍。
三种范式对比
| 维度 | ReAct | Plan-and-Solve | Reflection |
|---|---|---|---|
| 核心思想 | 边想边做 | 先规划后执行 | 先完成再反思 |
| 灵活性 | 高 | 中 | 中 |
| 准确率 | 中 | 中高 | 高 |
| 成本 | 低 | 中 | 高 |
| 复杂任务能力 | 中 | 高 | 高 |
| 工具调用 | 强 | 中 | 中 |
| 典型场景 | 搜索问答 | 项目规划 | 代码优化 |
当前主流Agent的做法
现实中的先进Agent很少只采用一种范式。
通常会融合:
Plan-and-Solve
↓
ReAct执行
↓
Reflection复盘
形成:
规划
↓
执行
↓
反思
↓
修正
闭环架构。
例如:
Claude Code
Plan
↓
编码
↓
测试
↓
Reflection
↓
修复
OpenManus
Plan
↓
ReAct执行
↓
工具调用
↓
Reflection优化
Deep Research
规划调研
↓
搜索资料
↓
交叉验证
↓
反思补充
↓
输出报告
Agent未来的发展趋势
当前Agent正在从单智能体向多智能体演化。
未来可能出现:
Multi-Agent
多个Agent协同工作。
例如:
产品经理Agent
↓
架构师Agent
↓
开发Agent
↓
测试Agent
共同完成项目。
Self-Evolving Agent
自我进化Agent。
能够:
自动发现问题
自动学习经验
自动优化Prompt
Agent Operating System
Agent操作系统。
未来可能出现:
Agent版Windows
Agent版Linux
用户只需提出需求,
Agent自动完成所有操作。
总结
如果用一句话概括三种经典Agent范式:
ReAct:
边思考边行动
Plan-and-Solve:
先规划再行动
Reflection:
先完成再反思
它们分别解决了 Agent 的三个核心问题:
ReAct:
如何行动
Plan-and-Solve:
如何规划
Reflection:
如何改进
而当前最先进的 Agent 系统,往往采用三者融合的方式:
Plan
↓
ReAct
↓
Reflection
这也是今天大多数 AI Agent 产品背后的核心架构思路。
更多推荐



所有评论(0)