AI Agent 的五层架构是构建具备自主规划与执行能力的智能代理系统的核心设计范式。

该架构将复杂的智能行为解耦为五个逻辑层次,确保了系统的模块化、可扩展性与可维护性。

以下是对每一层的深度讲解,涵盖其核心概念、应包含的组件以及关键设计要点。


一、 提示词与交互层 (Prompt & Interaction Layer)

核心概念
这是Agent与用户或外部环境进行语义交互的“神经接口”。

它不仅是简单的指令传递,更是意图识别、角色设定、上下文绑定与输出格式控制的编排中枢

其质量直接决定了Agent响应的准确性、有用性和安全性。

应该包含的组件

  1. 意图解析器:负责理解用户输入的深层目标,可能结合分类模型或规则引擎。
  2. 提示词模板引擎:存储和管理结构化的提示词模板,如ReAct、Chain-of-Thought等。
  3. 上下文管理器:负责维护对话历史、用户画像、会话状态等信息,并将其动态注入提示词。
  4. 输出格式化器:将大模型的原始输出解析、清洗并转换为下游组件(如工具层)可消费的结构化数据(如JSON)。
  5. 安全与合规过滤器:在输入和输出阶段进行内容安全审查,防止有害内容生成或敏感信息泄露。

应该如何设计

  • 设计要点实现意图与实现的解耦。将业务目标(“做什么”)与具体执行逻辑(“怎么做”)分离。
  • 实践建议
    • 采用结构化、参数化的提示词模板,避免硬编码的自然语言指令。
    • 建立提示词版本库,支持A/B测试和灰度发布,以持续优化提示效果。
    • 设计上下文窗口优化策略,如关键信息优先、历史摘要等,以应对大模型的上下文长度限制。
  • 代码示例(提示词模板与上下文管理)
    # 一个结构化的ReAct提示词模板
    REACT_TEMPLATE = """
    你是一个{role}。你的任务是:{task}。
    你有以下工具可用:{tools_list}。
    之前的对话历史:{history}。
    当前用户的问题是:{query}。
    
    请严格按照以下格式思考并回应:
    思考:<你分析和推理的过程>
    行动:<要调用的工具名称,必须是[{tool_names}]之一>
    行动输入:<传递给该工具的输入参数,必须是有效的JSON字符串>
    观察:<工具执行后的结果>
    ...(这个“思考/行动/观察”循环可以重复多次)
    最终答案:<基于所有观察得出的最终结论>
    """
    
    class ContextManager:
        def __init__(self, max_turns=10):
            self.conversation_history = []
            self.max_turns = max_turns
    
        def add_interaction(self, user_input, agent_response):
            """添加一轮对话到历史"""
            self.conversation_history.append({"user": user_input, "agent": agent_response})
            # 维护历史长度,可进行摘要压缩
            if len(self.conversation_history) > self.max_turns:
                self.compress_old_history()
    
        def get_relevant_history(self, current_query, k=3):
            """根据当前查询,检索最相关的k轮历史(可结合向量检索)"""
            # 简化示例:返回最近k轮
            return self.conversation_history[-k:]
    

二、 大语言模型层 (LLM Layer)

核心概念
作为Agent的“大脑”,此层封装了对大语言模型的调用。其核心职责是提供高质量的推理、规划、决策和内容生成能力。设计时需考虑模型选型、成本、延迟及故障处理。

应该包含的组件

  1. 模型抽象与路由:统一的API接口,可对接不同厂商(如OpenAI、Anthropic、本地模型)或不同规模的模型。
  2. 模型路由策略:根据任务类型、复杂度、成本预算,智能选择最合适的模型(如简单分类用小模型,复杂创作用大模型)。
  3. 性能与缓存模块:实现请求批处理、响应流式传输、结果缓存(对确定性高的查询)以优化性能和成本。
  4. 降级与容错机制:在主模型调用失败时,自动切换备用模型或提供优雅的降级响应。

应该如何设计

  • 设计要点抽象与冗余。通过抽象层隔离具体模型提供商,并通过路由和降级机制保证服务的可用性。
  • 实践建议
    • 定义统一的模型调用接口,隐藏不同SDK的细节。
    • 实施分级调用策略,例如先尝试快速廉价模型,若置信度低则回退到更强但更贵的模型。
    • 提示词和结果进行缓存,对于常见、确定性的问题可直接返回缓存结果,大幅降低成本和延迟。

三、 规划与推理层 (Planning & Reasoning Layer)

核心概念
这是Agent的“逻辑中枢”,负责将高层目标分解为可执行的具体步骤或子任务序列。它体现了Agent的自主性和策略性,常见的模式包括思维链(CoT)、ReAct(Reasoning+Acting)等。

应该包含的组件

  1. 任务分解器:将复杂用户请求(如“策划一次旅行”)拆解为有序的子任务(查机票、订酒店、做攻略)。
  2. 规划器:决定子任务的执行顺序、依赖关系和条件逻辑(如“只有酒店订成功后,才去租车”)。
  3. 反思与修正模块:在动作执行后评估结果,判断目标是否达成,若未达成则重新规划或调整策略。

应该如何设计

  • 设计要点可解释性与闭环反馈。规划过程应尽量透明(可日志记录),并能根据执行反馈进行动态调整。
  • 实践建议
    • 结合使用提示词工程(如Few-shot CoT)确定性算法进行规划。对于流程固定的任务,可使用工作流引擎;对于开放任务,则依赖LLM进行动态规划。
    • 设计统一的规划状态表示,便于在不同步骤间传递信息。
    • 实现规划验证,在执行前检查规划的逻辑合理性和资源可用性。
  • 代码示例(基于ReAct的简单规划循环)
    class ReActPlanner:
        def __init__(self, llm_client, tool_executor):
            self.llm = llm_client
            self.tools = tool_executor
            self.max_steps = 10
    
        def execute_plan(self, initial_goal):
            """执行ReAct循环以实现目标"""
            current_state = f"目标:{initial_goal}"
            for step in range(self.max_steps):
                # 1. 思考下一步
                thought_prompt = f"{current_state}
    

请思考下一步该做什么。"
thought = self.llm.generate(thought_prompt)

            # 2. 决定行动(调用哪个工具)
            action_prompt = f"{thought}

根据思考,决定要调用的工具和输入。"
action_dict = self.llm.generate_structured(action_prompt, schema=ActionSchema) # 解析为结构化动作

            # 3. 执行行动
            observation = self.tools.execute(action_dict["tool_name"], action_dict["input"])
            
            # 4. 更新状态,评估是否完成
            current_state += f"

步骤{step}: {thought}
行动:{action_dict}
观察:{observation}"
if self._is_goal_achieved(current_state, initial_goal):
return self._formulate_final_answer(current_state)

        return "任务未在最大步数内完成。"
```

四、 记忆与状态层 (Memory & State Layer)

核心概念
这是Agent的“经验库”,负责存储、检索和更新Agent在交互过程中获取的所有信息。

记忆系统使Agent具备了连续性和个性化的能力。

设计需平衡信息的丰富性、检索效率与上下文长度限制。

应该包含的组件

  1. 短期/工作记忆:保存当前任务相关的临时信息,如当前规划步骤、工具调用结果。
  2. 长期记忆:存储跨越多个会话的持久化信息,通常使用向量数据库实现语义检索,存储用户偏好、历史对话摘要、学到的知识等。
  3. 记忆索引与检索器:高效地从长期记忆中根据当前上下文检索最相关的信息。通常结合向量相似性搜索和关键词过滤。
  4. 记忆压缩与摘要模块:当对话历史过长时,自动将旧信息摘要压缩,以节省上下文窗口。

应该如何设计

  • 设计要点分层存储与关联检索。区分不同寿命和用途的记忆,并建立高效、精准的检索机制。
  • 实践建议
    • 采用向量数据库(如Chroma, Weaviate) 作为长期记忆的核心,利用嵌入模型将信息向量化。
    • 设计混合检索策略,结合向量相似性(语义)和元数据过滤(如时间、类型),提高召回准确率。
    • 实现记忆的主动更新与淘汰机制,定期清理过时或低价值信息。

五、 行动与工具层 (Action & Tools Layer)

核心概念
这是Agent的“手和脚”,负责将规划好的意图转化为对现实世界或数字世界的具体操作

工具是对Agent能力的扩展,使其能执行搜索、计算、调用API、操作软件等超出纯文本生成的任务。

应该包含的组件

  1. 工具注册中心:所有可用工具的目录,包含工具的名称、描述、参数schema和执行函数。
  2. 工具执行器:负责安全、可靠地调用工具。这是安全防护的关键节点。
  3. 工具编排器:管理工具间的依赖关系、执行顺序和参数传递。
  4. 安全沙箱:对于执行代码、访问文件系统等高危操作,提供隔离的运行环境。

应该如何设计

  • 设计要点安全性与描述性。工具调用必须安全可控,同时工具的描述必须准确,以便LLM层能正确理解和使用。
  • 实践建议
    • 为每个工具提供清晰、结构化的自然语言描述和参数定义,这是LLM正确调用工具的前提。
    • 实施严格的权限控制和输入验证。可采用类似OpenClaw的沙箱机制隔离高风险工具。
    • 设计工具调用标准化接口(如遵循OpenAI的Function Calling格式),并实现失败重试和降级处理逻辑
  • 代码示例(工具注册与安全调用)
    # 工具定义
    tools_registry = {
        "get_weather": {
            "description": "获取指定城市的当前天气。",
            "parameters": {
                "city": {"type": "string", "description": "城市名称"}
            },
            "function": call_weather_api,  # 实际执行的函数
            "risk_level": "low"  # 风险等级标识
        },
        "execute_shell": {
            "description": "在安全沙箱中执行Shell命令。",
            "parameters": {...},
            "function": sandbox_execute,
            "risk_level": "high"
        }
    }
    
    class SafeToolExecutor:
        def execute(self, tool_name, arguments):
            tool = tools_registry.get(tool_name)
            if not tool:
                raise ValueError(f"未知工具:{tool_name}")
            
            # 1. 权限与风险检查
            if tool["risk_level"] == "high" and not user.has_permission("high_risk"):
                raise PermissionError("无权执行高风险工具")
            
            # 2. 参数验证
            validate_arguments(tool["parameters"], arguments)
            
            # 3. 安全执行
            if tool["risk_level"] == "high":
                result = execute_in_sandbox(tool["function"], arguments) # 沙箱内执行
            else:
                result = tool["function"](**arguments) # 直接执行
            
            return result
    

总结,AI Agent的五层架构是一个环环相扣的系统工程。

提示词层是导航仪,LLM层是引擎,规划层是驾驶策略,记忆层是地图和经验,行动层是车轮和机械臂。

优秀的设计要求每一层职责清晰、接口标准化,并充分考虑层与层之间的数据流、错误处理与安全边界,从而构建出既强大又可靠的智能体系统。


参考来源

 

Logo

Agent 垂直技术社区,欢迎活跃、内容共建。

更多推荐