从零构建多智能体系统：基于Claude Code的架构设计与工程实践

多智能体系统（Multi-Agent System）是人工智能领域的重要分支，其核心在于多个自治智能体通过协作完成复杂任务。系统架构通常围绕智能体设计、通信机制和任务协调展开，关键技术包括提示工程（Prompt Engineering）、工具调用（Tool Calling）和事件驱动通信。在工程实践中，通过定义智能体基类封装角色、记忆与工具能力，并设计基于事件总线的发布-订阅模式实现解耦通信，能够

weixin_33725807

336人浏览 · 2026-05-25 16:32:35

weixin_33725807 · 2026-05-25 16:32:35 发布

1. 项目概述：当Claude Code成为你的全栈开发伙伴

最近在尝试构建一个多智能体系统时，我给自己设定了一个有点“自虐”的挑战：完全不依赖任何现成的框架，比如LangChain、AutoGen或者CrewAI，只使用Claude Code（这里指Claude的代码生成与理解能力）作为核心工具来完成。这听起来像是用瑞士军刀去盖房子，但实际走下来，我发现这个过程远比想象中更有启发性。它迫使你从第一性原理去思考智能体（Agent）究竟是什么，它们之间如何通信，状态如何管理，而不是被框架预设的抽象层所束缚。

这个项目的核心，是构建一个能够协作完成复杂任务的多个AI智能体集群。想象一下，你需要处理一个从市场分析、到技术方案设计、再到代码实现和文档编写的完整项目流程。一个全能型智能体可能力不从心，但如果你有一个“分析师”智能体负责拆解需求和调研，“架构师”智能体设计系统模块，“程序员”智能体编写代码，“测试员”智能体检查逻辑，“项目经理”智能体协调进度和汇总报告——那么整个流程就会变得清晰、高效且可追溯。这就是多智能体系统的魅力所在，而用纯代码“手搓”一套，能让你对每个齿轮的转动都了如指掌。

这个挑战适合谁呢？首先，是那些对AI智能体底层机制充满好奇的开发者，不满足于仅仅调用 AgentExecutor.run() ，想揭开黑盒看看里面到底怎么运转的。其次，是需要在高度定制化或受限环境中部署智能体应用的团队，比如对依赖包有严格管控，或者对执行流程有特殊编排需求的场景。最后，这也是一个绝佳的深度学习项目，你能在构建过程中彻底弄明白提示工程（Prompt Engineering）、思维链（Chain-of-Thought）、工具调用（Tool Calling）以及会话管理这些概念是如何落地成代码的。

整个构建过程，我会围绕几个核心模块展开：智能体的单体架构设计、智能体间的通信协议、任务调度与协调逻辑、以及持久化与状态管理。我们会用最朴素的Python代码，搭配上Claude Code强大的代码生成和逻辑推理能力，一步步把它们搭建起来。你会发现，没有框架，你反而获得了最大的灵活性。

2. 核心架构设计：定义你的智能体“基因”

抛开框架，我们首先要回答一个基本问题：一个智能体（Agent）的最小可行单元（MVP）应该包含什么？它不是一个简单的函数调用，而是一个具备感知、决策、执行和记忆能力的自治实体。

2.1 智能体基类：能力、记忆与工具的封装

我的设计起点是一个 BaseAgent 类。这个类是所有智能体的蓝图，它定义了智能体必须拥有的核心属性。首先是 role 和 goal ，这是智能体的“人设”和核心使命，决定了它对任务的理解和回应方式。例如，一个“代码审查员”的 goal 是“找出代码中的潜在bug和安全漏洞”，而一个“文案写手”的 goal 是“生成符合品牌调性的营销文案”。这两个字段会直接融入到发给大模型（如Claude）的系统提示（System Prompt）中。

其次是 memory 。智能体不能是“金鱼”，它需要记住之前的交互历史。我实现了一个简单的 ConversationMemory 类，使用双端队列（ collections.deque ）来保存最近N轮对话（用户输入和智能体输出）。这避免了上下文无限增长导致的大模型令牌（Token）超限问题。对于需要长期记忆的场景，可以额外连接一个向量数据库来存储和检索关键信息。

最核心的部分是 tools 。这是智能体与外部世界交互的手和脚。每个工具都是一个可调用的函数或方法。我设计了一个 Tool 类，包含 name （工具名）、 description （功能描述）、 parameters （参数JSON Schema）和 func （实际的可调用对象）。智能体在思考时，可以根据描述决定是否以及如何调用工具。例如，一个“网络搜索”工具，描述可以是“使用搜索引擎获取最新信息”，参数是 {"query": "搜索关键词"} 。

import json
from collections import deque
from typing import Dict, List, Callable, Any, Optional

class Tool:
    def __init__(self, name: str, description: str, parameters: Dict, func: Callable):
        self.name = name
        self.description = description
        self.parameters = parameters  # 符合OpenAI Tool Call格式的schema
        self.func = func

    def execute(self, **kwargs):
        """执行工具并返回结果。"""
        return self.func(**kwargs)

class ConversationMemory:
    def __init__(self, max_length: int = 10):
        self.memory = deque(maxlen=max_length)

    def add(self, user_input: str, agent_response: str):
        self.memory.append({"role": "user", "content": user_input})
        self.memory.append({"role": "assistant", "content": agent_response})

    def get_context(self) -> List[Dict]:
        return list(self.memory)

class BaseAgent:
    def __init__(self, name: str, role: str, goal: str, model_client: Any):
        self.name = name
        self.role = role
        self.goal = goal
        self.model_client = model_client  # 封装了Claude API调用的客户端
        self.memory = ConversationMemory()
        self.tools: Dict[str, Tool] = {}

    def register_tool(self, tool: Tool):
        self.tools[tool.name] = tool

    def _build_system_prompt(self) -> str:
        """构建系统提示，包含角色、目标和可用工具描述。"""
        tools_desc = "\n".join([f"- {name}: {tool.description}" for name, tool in self.tools.items()])
        return f"""你是一个{self.role}。你的核心目标是：{self.goal}。

你可以使用以下工具：
{tools_desc}

请严格根据你的角色和目标来思考和行动。如果需要使用工具，请清晰说明。
"""

注意：在构建系统提示时，工具描述的清晰度至关重要。模糊的描述会导致大模型错误地调用或不调用工具。我的经验是，采用“动词开头+具体功能+输入输出示例”的格式，例如“ calculate_sum : 计算一组数字的总和。输入是一个数字列表，输出是它们的和。示例：输入[1,2,3]，输出6。”

2.2 推理循环：从接收到响应的完整流程

有了骨架，接下来需要注入灵魂——智能体的“思考”过程。我设计了一个 think_and_act 方法，它构成了智能体的核心推理循环。这个过程模拟了人类处理问题的步骤：理解问题、思考方案、决定行动（是否调用工具）、评估结果、最终回应。

首先，智能体接收用户的 query 。它会将系统提示、历史记忆（ self.memory.get_context() ）和当前查询组合成完整的对话上下文，发送给大模型（这里是Claude）。关键的一步是，我要求模型以特定的JSON格式进行“思考”，这个JSON包含 thought （推理过程）、 action （决定采取的行动，是“respond”直接回答还是“use_tool”调用工具）、以及可选的 tool_name 和 tool_input 。

如果 action 是 use_tool ，代码就会从 self.tools 中找到对应的工具，用 tool_input 作为参数执行它，并将工具执行的结果作为一个新的“用户消息”附加到上下文，再次发送给模型，让它基于工具结果生成最终回复。这个“模型-工具-模型”的循环，是实现复杂任务的基础。

class BaseAgent(BaseAgent):  # 接上文
    def think_and_act(self, query: str) -> str:
        # 1. 构建消息历史
        messages = [
            {"role": "system", "content": self._build_system_prompt()},
            *self.memory.get_context(),
            {"role": "user", "content": query}
        ]

        max_iterations = 5  # 防止无限循环
        for i in range(max_iterations):
            # 2. 调用模型，要求结构化输出
            response = self.model_client.chat_completion(
                messages=messages,
                response_format={"type": "json_object"}  # 要求返回JSON
            )
            # 解析模型的JSON输出
            try:
                model_output = json.loads(response.content)
                thought = model_output.get("thought", "")
                action = model_output.get("action", "respond")
                tool_name = model_output.get("tool_name")
                tool_input = model_output.get("tool_input", {})

                print(f"[{self.name} 思考] {thought}")  # 打印思考过程，便于调试

                # 3. 根据行动决策执行
                if action == "use_tool" and tool_name in self.tools:
                    print(f"[{self.name} 行动] 调用工具: {tool_name}, 输入: {tool_input}")
                    tool_result = self.tools[tool_name].execute(**tool_input)
                    # 将工具结果作为新的用户消息，继续循环
                    messages.append({"role": "user", "content": f"工具 {tool_name} 返回的结果是: {tool_result}"})
                    continue  # 继续下一轮思考，基于工具结果
                else:
                    # 4. 生成最终回复
                    final_response = model_output.get("final_response", response.content)
                    self.memory.add(query, final_response)
                    return final_response

            except json.JSONDecodeError:
                # 如果模型没有返回合法JSON，直接将其输出作为回复
                self.memory.add(query, response.content)
                return response.content

        # 如果循环超过最大次数，返回超时信息
        timeout_msg = f"经过{max_iterations}轮推理仍未完成请求。"
        self.memory.add(query, timeout_msg)
        return timeout_msg

实操心得 ：强制模型返回JSON是关键一步，但模型有时会“不听话”。我的解决方案是在系统提示里加入更明确的指令，例如：“你必须以有效的JSON格式回复，且只包含 thought ， action ， tool_name ， tool_input ， final_response 这些键。”并在客户端代码中做好错误处理，当JSON解析失败时，尝试用正则表达式提取，或降级为直接使用文本回复。

3. 实现智能体间的通信与协作

单个智能体再强大，也只是单兵作战。多智能体系统的威力在于协作。如何让智能体们“开口说话”并有效配合，是接下来的核心挑战。我摒弃了复杂的消息队列，设计了一套基于事件总线和共享工作空间的轻量级通信机制。

3.1 事件总线：智能体世界的“广播系统”

我实现了一个简单的 EventBus （事件总线）类。它是一个中央调度器，智能体可以向它发布（ publish ）事件，也可以订阅（ subscribe ）感兴趣的事件。一个事件通常包含 type （事件类型，如 "task_announced" , "result_ready" ）、 sender （发送者）、 data （负载数据）和 target （可选，指定接收者）。

当一个智能体完成一项子任务，比如研究员找到了资料，它就会向事件总线发布一个 {"type": "research_complete", "data": findings, "sender": "Researcher"} 的事件。而负责汇总的“主编”智能体提前订阅了 research_complete 事件，事件总线就会把这个事件传递给“主编”，触发它的后续处理流程。

class EventBus:
    def __init__(self):
        self.subscribers: Dict[str, List[Callable]] = {}  # 事件类型 -> 回调函数列表

    def subscribe(self, event_type: str, callback: Callable):
        """订阅特定类型的事件。"""
        if event_type not in self.subscribers:
            self.subscribers[event_type] = []
        self.subscribers[event_type].append(callback)

    def publish(self, event: Dict):
        """发布一个事件，通知所有订阅者。"""
        event_type = event.get("type")
        if event_type in self.subscribers:
            for callback in self.subscribers[event_type]:
                # 在实际应用中，这里应该使用线程池或异步执行以避免阻塞
                try:
                    callback(event)
                except Exception as e:
                    print(f"处理事件 {event_type} 时回调函数 {callback} 出错: {e}")

# 智能体基类扩展，使其具备事件发布能力
class BaseAgent(BaseAgent):
    def __init__(self, name: str, role: str, goal: str, model_client: Any, event_bus: EventBus = None):
        super().__init__(name, role, goal, model_client)
        self.event_bus = event_bus

    def send_event(self, event_type: str, data: Any, target: Optional[str] = None):
        """向事件总线发送事件。"""
        if self.event_bus:
            event = {"type": event_type, "sender": self.name, "data": data, "target": target}
            self.event_bus.publish(event)

这种发布-订阅模式解耦了智能体之间的直接依赖。智能体不需要知道其他智能体的存在，只需要关心事件。这大大提高了系统的可扩展性，新增一个智能体只需让它订阅相关事件即可。

3.2 共享工作空间与任务分解器

通信解决了“对话”问题，协作还需要一个“黑板”来共享中间成果。我创建了一个 SharedWorkspace 类，本质上是一个键值存储，智能体可以将自己的产出（如研究摘要、代码片段、分析报告）以特定格式（如 task_123_research ， task_123_code ）存入其中。其他智能体可以按需读取。

但如何启动一次协作呢？我设计了一个 TaskOrchestrator （任务协调器）。它的核心是一个 decompose_task 方法。当用户提出一个复杂任务（如“开发一个个人博客网站”）时，协调器本身也是一个智能体（或调用一个大模型），它的职责是将宏大的任务分解成一系列有顺序或依赖关系的子任务。

例如，它可能分解为： [“进行竞品分析和功能需求梳理”， “设计网站技术架构和数据库Schema”， “实现用户认证模块后端API”， “开发博客文章CRUD前端页面”， “编写部署文档”] 。每个子任务会被分配一个ID，描述以及指定的执行智能体角色（如“研究员”、“架构师”、“后端工程师”）。

然后，协调器通过事件总线发布第一个子任务的事件。相应的智能体接收到事件后，从工作空间读取输入（可能是初始需求或上游任务的输出），执行自己的任务，将结果写回工作空间，并发布“任务完成”事件。协调器监听这些完成事件，再触发下一个依赖任务的开始，从而形成一个工作流。

class SharedWorkspace:
    def __init__(self):
        self.storage = {}

    def put(self, key: str, value: Any):
        self.storage[key] = value

    def get(self, key: str, default=None):
        return self.storage.get(key, default)

class TaskOrchestrator:
    def __init__(self, event_bus: EventBus, workspace: SharedWorkspace):
        self.event_bus = event_bus
        self.workspace = workspace
        self.task_queue = []  # 待执行任务队列
        self.completed_tasks = {}  # 已完成任务记录

    def decompose_task(self, master_task: str) -> List[Dict]:
        """（模拟）任务分解。实际应用中，这里会调用一个专门的“规划师”智能体或大模型。"""
        # 这是一个简化的硬编码示例。真实场景下，这里应是一个复杂的LLM调用。
        if "博客网站" in master_task:
            return [
                {"id": "task_1", "desc": "进行竞品分析和功能需求梳理", "assign_to": "Researcher", "depends_on": []},
                {"id": "task_2", "desc": "设计网站技术架构和数据库Schema", "assign_to": "Architect", "depends_on": ["task_1"]},
                {"id": "task_3", "desc": "实现用户认证模块后端API", "assign_to": "BackendDev", "depends_on": ["task_2"]},
                {"id": "task_4", "desc": "开发博客文章CRUD前端页面", "assign_to": "FrontendDev", "depends_on": ["task_2"]},
                {"id": "task_5", "desc": "编写部署文档", "assign_to": "TechnicalWriter", "depends_on": ["task_3", "task_4"]},
            ]
        return []

    def start_execution(self, master_task: str):
        """启动任务执行流程。"""
        subtasks = self.decompose_task(master_task)
        self.task_queue = subtasks.copy()
        # 将初始需求放入工作空间
        self.workspace.put("master_task", master_task)
        # 发布第一个无依赖的任务
        self._schedule_next_tasks()

    def _schedule_next_tasks(self):
        """检查并调度可以执行的任务（依赖已满足）。"""
        for task in self.task_queue[:]:  # 遍历副本
            task_id = task["id"]
            # 检查依赖是否全部满足
            deps_met = all(dep in self.completed_tasks for dep in task["depends_on"])
            if deps_met and task_id not in self.completed_tasks:
                print(f"[协调器] 调度任务: {task_id} - {task['desc']} 给 {task['assign_to']}")
                # 通过事件总线指派任务
                self.event_bus.publish({
                    "type": "task_assigned",
                    "sender": "Orchestrator",
                    "data": {"task": task},
                    "target": task["assign_to"]
                })
                # 从待执行队列中暂时移除（等待完成事件）
                self.task_queue.remove(task)

    def on_task_completed(self, event: Dict):
        """监听任务完成事件，更新状态并调度后续任务。"""
        task_id = event["data"]["task_id"]
        result = event["data"]["result"]
        self.completed_tasks[task_id] = result
        print(f"[协调器] 任务 {task_id} 已完成。")
        self.workspace.put(f"result_{task_id}", result)
        self._schedule_next_tasks()
        # 检查所有任务是否完成
        if not self.task_queue and len(self.completed_tasks) > 0:
            print(f"[协调器] 所有任务执行完毕！开始生成最终报告。")
            self._generate_final_report()

    def _generate_final_report(self):
        """汇总所有结果，生成最终报告。"""
        # 这里可以调用一个“报告员”智能体来整合工作空间中的所有结果
        final_data = {k: v for k, v in self.workspace.storage.items() if k.startswith('result_')}
        print("=== 项目最终成果汇总 ===")
        print(json.dumps(final_data, indent=2, ensure_ascii=False))

踩坑记录 ：在早期版本中，我让智能体直接互相调用方法，形成了紧密的耦合，导致添加一个新智能体需要修改好几个旧智能体的代码。改用事件总线后，系统变得非常灵活。另一个教训是任务依赖的死锁问题，比如任务A依赖B，B又依赖A。在 decompose_task 阶段就需要加入简单的循环依赖检测，或者设计更鲁棒的协调器逻辑，例如超时重试或依赖动态调整。

4. 从零搭建一个完整的多智能体项目实例

理论说得再多，不如动手跑一遍。让我们用上面的架构，实际构建一个“技术博客选题与大纲生成”的多智能体系统。这个系统包含四个智能体： TrendAnalyst （趋势分析师）、 IdeaBrainstormer （创意风暴者）、 OutlineArchitect （大纲架构师）和 Editor （编辑）。

4.1 环境准备与智能体初始化

首先，确保你有可用的Claude API密钥（或其他大模型API）。我们使用 anthropic 官方库（这里仅为示例，实际请安装对应包）。然后初始化事件总线和共享工作空间。

import os
from anthropic import Anthropic  # 示例，实际可用任何LLM API客户端

# 1. 初始化核心组件
event_bus = EventBus()
workspace = SharedWorkspace()
orchestrator = TaskOrchestrator(event_bus, workspace)

# 2. 创建模型客户端（简化示例，实际需处理鉴权、错误等）
class ClaudeClient:
    def __init__(self, api_key: str):
        # 此处仅为示意，实际调用需按Anthropic API规范
        self.client = Anthropic(api_key=api_key)

    def chat_completion(self, messages, response_format=None, **kwargs):
        # 模拟调用，重点在逻辑而非实际API
        # 实际调用可能是：self.client.messages.create(...)
        prompt = "\n".join([f"{m['role']}: {m['content']}" for m in messages])
        # 这里应该是一个真实的API调用，返回一个结构化的响应
        # 为了示例，我们返回一个模拟的JSON响应
        simulated_response = {
            "thought": "用户需要技术博客选题。我需要先分析当前趋势。",
            "action": "use_tool",
            "tool_name": "web_search",
            "tool_input": {"query": "2024年最热门的软件开发趋势"},
            "final_response": ""
        }
        class MockMessage:
            content = json.dumps(simulated_response)
        return MockMessage()

# 假设我们有一个模拟的客户端
model_client = ClaudeClient(api_key=os.getenv("CLAUDE_API_KEY"))

# 3. 创建并注册智能体
class TrendAnalyst(BaseAgent):
    def __init__(self, client, event_bus):
        super().__init__("TrendAnalyst", "技术趋势分析师",
                         "分析最新的软件开发、人工智能和科技行业趋势，并识别有潜力的博客话题方向。",
                         client, event_bus)
        # 注册工具（这里用模拟工具）
        self.register_tool(Tool(
            name="web_search",
            description="搜索互联网获取最新技术趋势和文章。输入是一个搜索查询字符串。",
            parameters={"type": "object", "properties": {"query": {"type": "string"}}},
            func=lambda query: f"模拟搜索结果：关于'{query}'，当前热门话题包括AI编程助手、Rust系统编程、WebAssembly应用等。"
        ))
        # 订阅任务分配事件
        self.event_bus.subscribe("task_assigned", self.handle_task)

    def handle_task(self, event: Dict):
        if event.get("target") == self.name:
            task = event["data"]["task"]
            print(f"[{self.name}] 收到任务: {task['desc']}")
            # 执行分析
            analysis_result = self.think_and_act(f"请分析当前技术趋势，并为技术博客提供3个潜在的选题方向。")
            # 将结果存入工作空间
            self.workspace.put(f"result_{task['id']}", analysis_result)
            # 发送任务完成事件
            self.send_event("task_completed", {"task_id": task["id"], "result": analysis_result})

# 类似地，创建其他智能体：IdeaBrainstormer, OutlineArchitect, Editor
# 每个智能体都有自己独特的角色、目标、工具和事件处理逻辑

4.2 运行协作流程与结果观察

初始化所有智能体并让协调器订阅任务完成事件后，我们就可以启动整个系统了。

# 4. 创建智能体实例并注册到协调器
analyst = TrendAnalyst(model_client, event_bus)
# brainstormer = IdeaBrainstormer(model_client, event_bus)
# architect = OutlineArchitect(model_client, event_bus)
# editor = Editor(model_client, event_bus)

# 协调器订阅任务完成事件
event_bus.subscribe("task_completed", orchestrator.on_task_completed)

# 5. 启动主任务
print("=== 启动多智能体博客选题系统 ===")
master_task = "为我们技术团队的技术博客，策划下一季度的核心选题并产出详细大纲。"
orchestrator.start_execution(master_task)

运行这段代码，你会在控制台看到类似如下的日志流，清晰地展示了智能体间的协作链条：

=== 启动多智能体博客选题系统 ===
[协调器] 调度任务: task_1 - 进行竞品分析和功能需求梳理 给 Researcher
[TrendAnalyst] 收到任务: 进行竞品分析和功能需求梳理
[TrendAnalyst 思考] 用户需要技术博客选题。我需要先分析当前趋势。
[TrendAnalyst 行动] 调用工具: web_search, 输入: {'query': '2024年最热门的软件开发趋势'}
[协调器] 任务 task_1 已完成。
[协调器] 调度任务: task_2 - 设计网站技术架构和数据库Schema 给 Architect
...
=== 项目最终成果汇总 ===
{
  "result_task_1": "趋势分析报告：...",
  "result_task_2": "系统架构图：...",
  ...
}

这个简单的例子展示了从任务分解、事件驱动执行到结果汇总的完整闭环。虽然工具是模拟的，但通信和协作的机制是完全真实的。

5. 性能优化、问题排查与进阶思考

构建一个能跑起来的系统只是第一步，要让它在实际中稳定、高效地运行，还需要考虑很多工程细节。

5.1 性能瓶颈与优化策略

大模型调用延迟 ：这是最主要的性能瓶颈。优化方法包括：
- 异步调用 ：使用 asyncio 和 aiohttp 将所有的 model_client.chat_completion 调用改为异步，让多个智能体在等待模型响应时可以处理其他事件。
- 批处理 ：如果多个智能体的提示准备就绪，可以考虑将请求批量发送给支持批处理的API，但要注意上下文隔离。
- 缓存：对常见的、确定性的查询（如“什么是REST API？”）结果进行缓存，避免重复计算。
推理循环失控 ：智能体可能陷入“思考-调用工具-再思考”的死循环。除了设置 max_iterations 硬性限制外，更智能的做法是在系统提示中强调“在得到足够信息后应果断给出最终答复”，并设计一个 confidence 评分，当模型对当前答案置信度足够高时自动跳出循环。
事件总线拥堵 ：如果事件非常多，同步的事件处理会成为瓶颈。可以将 EventBus 改造成异步的，使用 asyncio.Queue 来管理事件流，消费者协程从队列中取出事件处理。

5.2 常见问题与调试技巧

在开发过程中，我遇到了不少问题，总结了一个排查清单：

问题现象	可能原因	排查步骤与解决方案
智能体不调用工具	1. 工具描述不够清晰。 2. 系统提示未强调使用工具。 3. 模型输出JSON解析失败。	1. 检查并优化工具描述，确保无歧义。 2. 在系统提示中加入“当你需要最新信息或计算时，必须使用提供的工具。” 3. 打印出模型的原始响应，检查JSON格式是否正确；增强JSON解析的鲁棒性。
协作流程卡住	1. 任务依赖未满足，形成死锁。 2. 事件丢失或未被处理。 3. 某个智能体处理超时或出错。	1. 打印协调器的任务队列和完成列表，检查依赖关系图。 2. 为事件总线添加日志，记录每个事件的发布和消费情况。 3. 为每个智能体的 `think_and_act` 方法添加超时机制和异常捕获，出错时发布 `task_failed` 事件，由协调器进行重试或错误处理。
输出质量不稳定	1. 提示词（Prompt）设计不佳。 2. 上下文历史过长或混乱。 3. 不同智能体角色设定冲突。	1. 进行系统的提示词迭代（A/B测试），使用更明确、具体的指令。 2. 优化 `ConversationMemory` ，只保留最相关的历史，或对长历史进行摘要。 3. 审查各智能体的 `role` 和 `goal` ，确保它们职责分明，不会越界或重复劳动。
系统资源消耗大	1. 同步阻塞式调用。 2. 内存中保存了过多历史或中间状态。	1. 如前所述，改为异步架构。 2. 定期清理工作空间中不再需要的数据，或将不常用的数据持久化到磁盘/数据库。

调试心得 ：在系统关键节点（如事件发布/订阅、工具调用前后、任务状态变更时）添加详细的结构化日志（如使用Python的 logging 模块并输出JSON格式），这比 print 语句强大得多，可以方便地导入到日志分析系统（如ELK Stack）中进行可视化追踪。为每个任务和会话生成唯一的 correlation_id ，并贯穿整个调用链，这样无论日志多么分散，你都能轻松拼凑出一次完整请求的全貌。

5.3 安全性与可靠性考量

在没有框架兜底的情况下，这些需要自己动手：

输入输出过滤 ：对所有从外部接收的输入（包括用户查询和工具返回结果）进行清洗和验证，防止提示词注入攻击。对智能体输出的内容，特别是如果涉及执行代码或系统命令，要进行严格的沙箱隔离和安全审查。
速率限制与退避 ：自己实现针对大模型API的速率限制和错误重试逻辑（如指数退避）。这能避免因API限制导致整个系统瘫痪。
持久化与状态恢复 ：将工作空间的状态和任务进度定期持久化到数据库（如SQLite或Redis）。这样即使系统崩溃重启，也能从断点恢复，而不是从头开始。

6. 超越基础：扩展性与高级模式

当你掌握了这套基础架构后，可以尝试更复杂的模式，这将极大提升系统的能力。

动态智能体编排 ：目前的协调器是预定义工作流。可以升级为一个“元智能体”（Meta-Agent），它根据当前任务的结果动态地决定下一步调用哪个智能体，甚至临时创建新的子任务。这需要更强大的任务规划和评估能力。

智能体技能市场 ：你可以建立一个“技能注册中心”，智能体可以将自己提供的工具或能力注册上去。当新任务到来时，协调器可以查询这个市场，动态组装最合适的智能体团队来应对，实现真正的按需组合。

人类在环（Human-in-the-loop） ：在关键决策点（如发布最终报告前、执行高风险操作前）引入人工确认。可以设计一个 HumanApprovalTool ，当被调用时，它会将待决策信息发送到指定界面（如Slack、邮件），并阻塞等待人工输入 批准 或 拒绝 后再继续流程。

长期记忆与个性化 ：为每个智能体接入向量数据库（如ChromaDB， Pinecone），将其长期的经验和知识存储为向量。当遇到新问题时，先进行向量相似度搜索，找到相关的历史经验作为上下文，让智能体变得更“聪明”和“个性化”。

经过这次“从零造轮子”的旅程，我最大的体会是，框架确实能极大提升开发效率，但亲手构建一遍核心机制，让你对智能体系统的每一个细节都有了深刻的理解。这种理解，在你需要调试一个诡异的问题、优化一个关键的性能瓶颈，或者实现一个框架不支持的极端定制化功能时，会变得无比珍贵。它让你从框架的“使用者”变成了智能体思维的“驾驭者”。下次当你再用回LangChain时，你会更清楚它每个组件背后试图解决的问题，甚至能更好地贡献代码。

AI Agent技术社区

Agent 垂直技术社区，欢迎活跃、内容共建。

更多推荐

AI导出鸭惊了！DeepSeek代码手机导出保姆级实操，不看亏一套海景房

AI Agent技术社区

后端接入 AI Agent：Tool Calling 网关、幂等与审计日志实战

AI Agent技术社区

OpenClaw vs Hermes Agent：企业级执行 vs 自我进化，一文读懂怎么选！

AI Agent 开源双子星深度对比：OpenClaw（GitHub 26.4w⭐）主打工程化落地，四层记忆+20+渠道+13,700+技能，适合企业自动化；Hermes Agent（53天10w⭐）主打闭环学习，四级记忆+自动技能进化+3,200+社区技能，越用越聪明。两者可互补组合：OpenClaw 做稳定执行引擎，Hermes 做持续学习大脑。短期落地选 OpenClaw，长期陪伴选 Her