OpenClaw多Agent系统搭建实战：阿里云+GLM-5+飞书协同部署指南

weixin_30876945

383人浏览 · 2026-06-19 14:30:58

weixin_30876945 · 2026-06-19 14:30:58 发布

1. 项目概述：这不是装个软件，而是给AI配一支“特种作战小队”

2026年，OpenClaw 已经不是那个需要你手动改配置、查日志、对着报错信息反复猜的实验性工具了。它演变成了一个真正能嵌入日常工作的“AI协作操作系统”。标题里写的“喂饭级图文教程”，不是夸张——我亲眼见过一位完全没碰过命令行的市场总监，在阿里云轻量服务器上，用32分钟完成从购买、部署、配置API到让6个AI助手在飞书里各司其职的全过程。她全程只复制粘贴了7条命令，其余时间都在和机器人聊天。

但“喂饭”不等于“无脑”。真正的难点从来不在安装本身，而在于 理解多Agent系统的设计哲学 。很多人卡在第一步，不是因为不会敲 openclaw init ，而是根本没想清楚：为什么我要同时开6个Agent？它们之间怎么不打架？谁发号施令？谁管记忆？谁负责擦屁股？这些问题不厘清，装得再快，三天后也是一地鸡毛。

OpenClaw 的核心价值，是把“一个AI干所有活”的混沌状态，变成“一支有指挥链、有专业分工、有独立记忆的虚拟团队”。这背后是三个关键设计原则：

物理隔离 ：每个Agent不是换个名字的同一个模型，而是拥有自己独立的工作空间（ ~/.openclaw/workspace-code ）、专属会话存储、甚至可选的专用模型实例。代码助手写Python时，会议秘书绝不会被它的调试日志污染上下文。
角色固化 ： code-helper 就是程序员， meeting-secretary 就是速记员， main 是项目经理兼调度员。它们不“切换角色”，而是“坚守岗位”。你不需要告诉它“现在你是写代码的”，它生来就是。
网关调度 ：所有外部请求（飞书消息、WebUI输入、CLI调用）都先打到 openclaw gateway 这个统一入口。网关根据预设规则（比如“来自飞书ID为xxx的群聊的消息，路由给 meeting-secretary ”），把任务精准分发，再把结果打包返回。它像机场塔台，不参与具体飞行，但确保每架飞机起降有序。

所以，这篇指南要解决的，不是“怎么装”，而是“怎么建制”。我会带你从零开始，亲手搭建一支能长期稳定服役的AI小队，覆盖从本地笔记本到阿里云服务器的全场景。你会看到，为什么在Windows上必须用WSL2而不是直接装；为什么MacOS的 launchd 配置比Linux的 systemd 更省心；为什么阿里云部署时，地域选香港比选北京更实际——这些都不是玄学，全是实测踩坑后总结出的硬逻辑。

关键词里的“OpenClaw”、“阿里云”、“多Agent”、“本地搭建”，每一个都指向一个具体的技术决策点。接下来的内容，就是把这些点连成一条可执行、可复现、可长期维护的路径。

2. 系统架构与方案选型：为什么是这套组合，而不是别的？

搭建一个多Agent系统，本质是在做一次小型的分布式服务架构设计。你面对的不是单个程序，而是一个由多个自治单元（Agent）、一个中央调度器（Gateway）、一个持久化层（Workspace）和一个外部通信总线（Channel）组成的微服务集群。选型错误，后期维护成本会指数级上升。我们来拆解2026年这套方案背后的硬核考量。

2.1 核心引擎：Node.js + CLI 架构的取舍

OpenClaw 选择 Node.js 作为底层运行时，并非偶然。很多新手看到“AI Agent”就默认该用 Python，这是个典型误区。Python 在模型推理、数据处理上无可替代，但作为 服务网关和协调中枢 ，它有两大硬伤：

并发模型瓶颈 ：Python 的 GIL（全局解释器锁）使其在高并发 I/O 场景（如同时处理几十个飞书机器人消息）下，性能远不如 Node.js 的事件驱动异步模型。实测中，当飞书群聊消息峰值达到 50 QPS 时，基于 Python 的同类网关平均响应延迟飙升至 1.8 秒，而 OpenClaw 稳定在 230ms 内。
进程管理复杂度 ：要让多个 Python 进程（每个Agent一个）稳定共存、互相通信、统一启停，需要额外引入 supervisord 或 systemd 的复杂配置。Node.js 的单进程多线程（Worker Threads）模型，天然支持在一个主进程中 fork 出多个子进程（Agent），并通过 IPC 高效通信， openclaw gateway restart 一条命令就能优雅重启整个集群。

CLI（命令行界面）作为唯一交互入口，是另一个深思熟虑的设计。它强制用户通过结构化命令（ openclaw agents add , openclaw configure ）来操作，而非直接编辑 JSON 配置文件。这看似增加了学习成本，实则极大降低了误操作风险。我见过太多用户手抖删掉配置文件里一个逗号，导致整个网关启动失败，排查两小时才发现是语法错误。CLI 命令自带参数校验和默认值填充，相当于内置了一层安全防护。

2.2 模型层：为什么全部推荐阿里云百炼 GLM-5？

标题和热词里反复出现“阿里云”，绝非营销噱头。2026年，GLM-5 成为 OpenClaw 多Agent 生产环境的 事实标准 ，原因有三：

成本与稳定性平衡 ：本地部署 Ollama + Qwen3.5:9b，单次推理成本近乎为零，但内存占用高达 12GB，且在 Windows WSL2 下 GPU 加速支持极差，推理速度只有阿里云 API 的 1/4。而阿里云百炼的 GLM-5 免费额度（每月 100 万 token）足以支撑一个中等规模团队的日常使用，且 SLA（服务等级协议）保障 99.95% 的可用性，远超任何本地自建模型服务。
上下文长度与一致性 ：GLM-5 提供 32K tokens 的上下文窗口，且在长文本摘要、多步骤推理上表现稳定。对比之下，本地部署的 Llama-3-8B，虽然开源免费，但在处理超过 8K tokens 的会议纪要+项目文档混合输入时，经常出现关键信息遗漏或逻辑断裂。多Agent协作的核心是“记忆接力”，一个环节记错了，后面全盘皆输。
生态无缝集成 ：OpenClaw 的 alibaba-cloud provider 是官方深度适配的。它自动处理 API Key 的轮换、请求重试、流式响应解析（SSE），甚至能将飞书消息中的富文本（加粗、列表、图片链接）原样传递给模型，并将模型返回的 Markdown 结构化输出，精准渲染回飞书。这种开箱即用的体验，是任何第三方模型 API 都无法比拟的。

提示：不要被“免费”二字迷惑。阿里云百炼的免费额度是按“调用次数+token消耗”双重计费的。一个 tech-writer Agent 生成一篇 2000 字技术文章，平均消耗约 15,000 tokens。这意味着每月免费额度可支撑约 66 篇高质量文章产出。超出后按 0.0001 元/token 计费，成本依然可控。而本地模型一旦显存爆满，服务直接宕机，这才是真正的“不可用”。

2.3 部署平台：阿里云、MacOS、Linux、Windows 的真实战力排序

网络热词里“阿里云服务器docker 社区版是自带docker环境吗”这类问题，暴露了一个普遍误解：以为 Docker 是万能胶。实际上，对于 OpenClaw 这类以 CLI 和进程管理为核心的工具，Docker 反而是累赘。官方镜像（OpenClaw(Moltbot)镜像）是基于 Ubuntu 22.04 的精简版， 直接安装二进制包，不依赖 Docker 。这带来了三大优势：

启动速度 ：裸机部署 openclaw gateway start 耗时 < 800ms；Docker 容器启动平均需 3.2 秒，且每次更新都要重建镜像。
资源开销 ：Docker daemon 自身常驻内存约 300MB，对 2GiB 内存的轻量服务器是巨大负担。裸机部署，OpenClaw 全栈内存占用稳定在 450MB 以内。
调试便利性 ：出问题时， ps aux | grep openclaw 一眼看清所有进程树；Docker 里则要 docker exec -it <container> ps aux ，多一层跳转。

那么，四大平台的真实体验如何？按“开箱即用度”和“长期稳定性”综合排序：

MacOS（首选） ：Apple Silicon 芯片对 Node.js 的优化极佳， openclaw service install mac 生成的 launchd 配置，能实现真正的开机即服务、崩溃自恢复、日志自动轮转。实测连续运行 127 天无须人工干预。
阿里云轻量应用服务器（次选） ：Ubuntu 22.04 + 2vCPU/4GiB 内存的配置，是性价比之王。关键是它提供了“一键放通端口”、“一键配置API-Key”等图形化操作，把原本需要 15 条命令的配置，压缩成 3 次鼠标点击。对于需要 7x24 小时在线、多设备访问的场景，它是唯一靠谱的选择。
Linux（Ubuntu/Debian） ： systemd 服务管理成熟稳定，但配置稍繁琐。最大的坑是 User=$USER 这一行——如果用 root 用户安装， $USER 会变成 root ，导致普通用户无法访问 WebUI。必须手动修改 service 文件，指定为你的实际用户名。
Windows 11（仅限开发测试） ：官方明确推荐 WSL2（Ubuntu），而非原生 Windows。原因残酷：Windows 的 cmd.exe 和 PowerShell 对 Node.js 的信号处理（如 Ctrl+C 终止进程）存在兼容性问题， openclaw gateway stop 命令有时会失效，导致僵尸进程堆积。WSL2 则完美规避了所有 Windows 底层限制。

注意：所有平台的前置依赖（Node.js v22+, Python 3.9+）都必须严格满足。我曾帮一位用户排查了两天，最后发现是 Node.js 版本为 v20.12.0， openclaw config wizard 的交互式菜单会因 readline 模块的 API 变更而无限卡死。升级到 v22.0.0 后，问题瞬间消失。

3. 核心细节解析与实操要点：从命令行到生产环境的每一处陷阱

光知道“该装什么”远远不够。真正的差距，体现在对每一个命令、每一个参数、每一个配置项背后意图的深刻理解。下面这些细节，是我在上百次部署中，用血泪换来的经验结晶。

3.1 `openclaw agents add` 命令的隐藏参数与工作空间设计

创建 Agent 的命令 openclaw agents add code-helper --model alibaba-cloud/glm-5 --workspace ~/.openclaw/workspace-code ，表面看很简单，但三个参数各有玄机：

--model ：这里填的不是模型名，而是 Provider + Model ID 的完整标识符 。 alibaba-cloud/glm-5 是一个“地址”，告诉网关：“去阿里云百炼，调用名为 glm-5 的模型”。如果你填 ollama/qwen3.5:9b ，网关就会尝试连接本地 http://localhost:11434 。这个设计让模型切换变得极其灵活，无需重装软件。
--workspace ：这是最易被忽视，却最关键的一环。 ~/.openclaw/workspace-code 不只是一个文件夹，它是该 Agent 的 专属大脑 。里面包含：
- sessions/ ：所有历史对话记录，按日期分文件夹存储，每个 .json 文件就是一个独立会话。
- skills/ ：该 Agent 可调用的工具脚本（如 git_commit.sh , excel_analyze.py ）。
- config.json ：该 Agent 的个性化设置，如默认温度（ temperature ）、最大输出长度（ max_tokens ）。
实操心得： 永远为每个 Agent 创建独立的 workspace 。我见过最惨的案例，是用户图省事，所有 Agent 共用 ~/.openclaw/workspace 。结果 meeting-secretary 的会议纪要模板，被 code-helper 的代码调试日志覆盖，导致后续所有会议记录格式错乱。 --workspace 参数不是可选项，是铁律。
--description （隐藏参数）：官方文档没提，但 CLI 支持。 openclaw agents add tech-writer --description "Responsible for writing technical articles and tutorials" 。这个描述会被写入 Agent 的元数据，当你执行 openclaw agents list 时，终端会清晰显示每个 Agent 的职责，避免日后忘记 project-assistant 和 researcher 的区别。

3.2 飞书机器人绑定：从“能用”到“好用”的质变

热词里“飞书”出现频率极高，但多数教程只教你怎么把机器人加进群，却没告诉你如何让它真正“听懂人话”。绑定飞书机器人的核心，是 openclaw.json 配置文件中的 bindings 数组。上面示例里只写了 id ，这远远不够。

一个生产环境可用的 bindings 配置，应该像这样：

{
  "bindings": [
    {
      "agentId": "code-helper",
      "match": {
        "channel": "feishu",
        "peer": {
          "kind": "group",
          "id": "your_code_group_id"
        },
        "trigger": ["@code-helper", "/code"]
      }
    },
    {
      "agentId": "meeting-secretary",
      "match": {
        "channel": "feishu",
        "peer": {
          "kind": "group",
          "id": "your_meeting_group_id"
        },
        "trigger": ["@meeting-secretary", "/meeting", "会议纪要"]
      }
    }
  ]
}

关键新增点：

trigger 字段：定义了触发该 Agent 的“唤醒词”。 @code-helper 是飞书@机器人， /code 是自定义指令。这意味着，你在飞书群里发 /code help ，或者 @code-helper 帮我写个Python脚本读取Excel ，都会被精准路由。没有 trigger ，机器人只会响应所有消息，造成严重干扰。
peer.kind ：除了 group （群聊），还支持 user （私聊）。你可以为 main Agent 设置 peer.kind: "user" ，这样所有私聊消息都由主控中心处理，再由它根据语义分发给子Agent，实现真正的“智能路由”。

实操心得： 永远先在小群测试，再推广到大群 。我曾在一个 500 人的产品大群上线 tech-writer ，结果有人开玩笑发 /tech-writer 写篇《论如何优雅地摸鱼》 ，机器人真就吭哧吭哧写了 800 字。后来加了 trigger 和内容过滤规则，才杜绝此类事故。

3.3 `openclaw config wizard` 的交互逻辑与 API Key 安全实践

openclaw configure --section models 是新手首选，但它并非万能。它的交互流程是线性的：依次问你 Provider、API Key、Secret、Region、Model。问题在于，它会把所有信息明文写入 ~/.openclaw/openclaw.json 。对于个人开发者没问题，但对于企业环境，这是重大安全隐患。

更安全的做法是 环境变量注入 。OpenClaw 支持读取 OPENCLAW_ALIBABA_CLOUD_API_KEY 和 OPENCLAW_ALIBABA_CLOUD_API_SECRET 这两个环境变量。你可以在服务器上这样操作：

# 编辑系统级环境变量
sudo nano /etc/environment
# 在文件末尾添加两行
OPENCLAW_ALIBABA_CLOUD_API_KEY="your_actual_key_here"
OPENCLAW_ALIBABA_CLOUD_API_SECRET="your_actual_secret_here"

# 重启网关，它会自动读取
openclaw gateway restart

这样做的好处是：

openclaw.json 文件里完全不出现任何密钥，配置文件可以放心提交到 Git 仓库进行版本管理。
密钥与配置分离，更换 API Key 时，只需修改 /etc/environment ，无需触碰任何 OpenClaw 配置。
符合企业安全审计要求，密钥生命周期由运维团队统一管理。

注意： /etc/environment 是系统级文件，修改后需要重新登录 SSH 才能生效。如果想立即生效，可以临时在当前会话中 export ，但这种方式在网关重启后会丢失。

4. 全平台实操过程：从零开始，亲手搭建你的AI小队

现在，让我们进入最硬核的部分：手把手，一步步，完成一次完整的、可复现的部署。我会以“阿里云轻量服务器”为蓝本，因为它代表了最典型的生产环境。其他平台的差异点，我会在对应步骤中标注。

4.1 阿里云部署：30分钟喂饭级全流程（含避坑详解）

目标：在阿里云轻量应用服务器上，部署一个能长期稳定运行、6个Agent各司其职、可通过飞书访问的 OpenClaw 多Agent 系统。

前置准备 ：

一台已实名认证的阿里云账号。
一张可用的支付方式（用于购买服务器）。
一个已创建的飞书企业账号（用于绑定机器人）。

Step 1：选购并初始化服务器（耗时约 5 分钟）

访问阿里云轻量应用服务器控制台。
点击【创建轻量应用服务器】。
关键配置 ：
- 镜像：务必选择 OpenClaw(Moltbot) 2026.3 。这是官方预装了所有依赖（Node.js v22, Python 3.9, npm 镜像）的定制镜像。选错 Ubuntu 原生镜像，你将多花 20 分钟手动安装。
- 实例规格 ： 最低要求 2vCPU + 4GiB 内存 。1vCPU/2GiB 的配置，在同时运行 6 个 Agent 时，内存会频繁告警，导致 gateway 进程被 OOM Killer 杀死。
- 地域： 强烈推荐“中国（香港）” 。这是唯一一个既免备案、又支持阿里云百炼全功能（包括联网搜索）的内地可选地域。选“北京”或“上海”，百炼的联网插件会提示“地域不支持”。
- 网络：保持默认，确保公网 IP 已分配。
点击【立即购买】，完成支付。服务器创建成功后，你会收到一封包含 root 密码的邮件。

Step 2：SSH 登录并验证基础环境（耗时约 2 分钟）

打开终端（Mac/Linux）或 PuTTY（Windows）。
执行 ssh root@<你的服务器公网IP> ，输入密码登录。

执行以下命令，验证预装环境是否正常：

# 检查 Node.js 版本
node -v # 应输出 v22.0.0 或更高
# 检查 Python 版本
python3 -V # 应输出 Python 3.9.x 或更高
# 检查 OpenClaw 是否已全局安装
openclaw --version # 应输出 2026.3.7-beta.1

如果以上任一命令报错，说明镜像未正确加载，请重置系统并重新选择 OpenClaw(Moltbot) 镜像。

Step 3：一键放行端口与配置 API（耗时约 3 分钟）

在阿里云轻量服务器控制台，找到你的实例，点击【更多】->【网络和安全组】->【防火墙】。

点击【添加规则】，一次性添加三条规则：

端口范围	协议类型	授权对象	说明
18789	TCP	0.0.0.0/0	OpenClaw WebUI 访问端口
22	TCP	0.0.0.0/0	SSH 远程管理端口（可选，仅限初期配置）
443	TCP	0.0.0.0/0	后期对接飞书 Webhook 所需（必须）

返回控制台首页，点击【应用详情】页签。
找到【一键配置】区域，点击【一键放通端口】，等待状态变为“成功”。
点击【配置百炼API-Key】，在弹出框中， 粘贴你从阿里云百炼控制台获取的 Access Key ID 和 Access Key Secret 。注意：Access Key Secret 是密钥，不是密码，务必准确复制，一个字符都不能错。
点击【执行命令】，系统会自动将密钥写入配置，并重启网关。

Step 4：创建并验证 6 个核心 Agent（耗时约 5 分钟）

在 SSH 终端中，逐条执行以下命令（可复制粘贴）：

# 创建主控中心
openclaw agents add main --model alibaba-cloud/glm-5 --workspace ~/.openclaw/workspace-main --description "Main controller, routes tasks to other agents"
# 创建编程助手
openclaw agents add code-helper --model alibaba-cloud/glm-5 --workspace ~/.openclaw/workspace-code --description "Writes, debugs and optimizes code"
# 创建会议秘书
openclaw agents add meeting-secretary --model alibaba-cloud/glm-5 --workspace ~/.openclaw/workspace-meeting --description "Takes meeting notes and extracts action items"
# 创建项目助手
openclaw agents add project-assistant --model alibaba-cloud/glm-5 --workspace ~/.openclaw/workspace-project --description "Tracks project progress and sends reminders"
# 创建技术写作
openclaw agents add tech-writer --model alibaba-cloud/glm-5 --workspace ~/.openclaw/workspace-writer --description "Writes technical articles and tutorials"
# 创建研究员
openclaw agents add researcher --model alibaba-cloud/glm-5 --workspace ~/.openclaw/workspace-research --description "Researches and analyzes industry data"
# 查看所有 Agent，确认创建成功
openclaw agents list

终端应输出一个包含 6 行的表格，每行显示 Agent ID、Model、Workspace Path 和 Description。如果某一行缺失，说明创建失败，检查上一条命令的输出错误。

Step 5：配置飞书机器人绑定（耗时约 10 分钟）

在飞书网页端，进入你的目标群聊（例如“技术讨论群”）。
点击右上角【...】->【群设置】->【群机器人】->【添加机器人】->【自定义机器人】。
填写机器人名称（如 Code Helper Bot ），点击【创建】，复制生成的 Webhook URL 。
回到 SSH 终端，编辑 OpenClaw 配置文件：
```
nano ~/.openclaw/openclaw.json
```

找到 bindings 字段（可能为空数组 [] ），将其替换为以下内容（请务必将 your_code_group_id 替换为你的实际群ID）：

"bindings": [
  {
    "agentId": "code-helper",
    "match": {
      "channel": "feishu",
      "peer": {
        "kind": "group",
        "id": "your_code_group_id"
      },
      "trigger": ["@code-helper", "/code"]
    }
  }
]

如何获取飞书群ID？ 这是最容易卡住的一步。正确方法是：
1. 在飞书群聊中，@ 任意一个已存在的机器人（比如飞书自带的“日历”机器人），发送一条消息。
2. 在 SSH 终端，执行 openclaw logs --follow 。
3. 在飞书中刷新群聊，你会在终端日志中看到类似 {"event":"message_received","data":{"chat_id":"oc_abc123def456ghi789jkl012mno","text":"@calendar ..."}} 的日志。其中 chat_id 的值 oc_abc123def456ghi789jkl012mno 就是你的群ID。
保存文件（ Ctrl+O , Enter , Ctrl+X ），然后重启网关：
```
openclaw gateway restart
```

Step 6：最终验证与访问（耗时约 2 分钟）

打开浏览器，访问 http://<你的服务器公网IP>:18789 。
你应该能看到 OpenClaw 的 WebUI 登录页面。首次访问，系统会提示你设置管理员密码。
设置密码后，登录 WebUI。在左侧导航栏，点击【Agents】，你应该能看到所有 6 个 Agent 的状态均为 Running 。
回到飞书群聊，发送 /code help ，几秒钟后， code-helper 机器人应该会回复一份详细的帮助文档。

至此，你的 AI 小队已正式上岗。整个过程，严格控制在 30 分钟内。所有命令均可复制粘贴，所有配置均有明确依据。

4.2 其他平台的关键差异点速查

MacOS ： openclaw service install mac 生成的 launchd 配置，默认将日志输出到 ~/Library/Logs/com.openclaw.gateway.log 。如果你想查看实时日志，用 tail -f ~/Library/Logs/com.openclaw.gateway.log ，而不是 openclaw logs --follow （后者在守护进程模式下不工作）。
Linux (Ubuntu) ： systemd 服务启动后，日志会进入 journalctl 。查看日志的正确命令是 sudo journalctl -u openclaw -f ，而不是 openclaw logs 。
Windows 11 (WSL2) ：在 WSL2 中， openclaw gateway start 启动的服务， 默认只能在 WSL2 内部访问 （ http://localhost:18789 ）。要在 Windows 主机的浏览器中访问，必须在 WSL2 中执行 echo $(cat /etc/resolv.conf | grep nameserver | awk '{print $2}'):18789 获取 WSL2 的 IP，然后在 Windows 浏览器中访问 http://<WSL2_IP>:18789 。这是 WSL2 网络模型的固有限制，无法绕过。

5. 常见问题与排查技巧实录：那些官方文档不会写的“血泪史”

再完美的教程，也挡不住现实世界的千奇百怪。以下是我整理的，来自真实用户社群的 Top 10 高频问题，以及每一个问题背后，我亲自验证过的、最有效的解决方案。

5.1 部署阶段：从“命令找不到”到“端口打不开”

问题现象	根本原因	一招制敌的解决方案	实操心得
`openclaw: command not found`	Node.js 版本过低，或 npm 全局安装路径未加入 `$PATH`	终极方案：卸载所有 Node.js，用 `curl -fsSL https://deb.nodesource.com/setup_22.x	sudo -E bash - && sudo apt install -y nodejs `重装。然后执行` echo 'export PATH=$HOME/.npm-global/bin:$PATH' >> ~/.bashrc && source ~/.bashrc`
`EACCES: permission denied`	npm 默认将全局包安装到 `/usr/lib/node_modules/` ，而当前用户无写入权限	安全方案：执行 `mkdir ~/.npm-global && npm config set prefix '~/.npm-global' && echo 'export PATH=~/.npm-global/bin:$PATH' >> ~/.bashrc && source ~/.bashrc` 。之后 `npm install -g openclaw` 就会安装到你的家目录，彻底告别权限问题。	永远不要用 `sudo npm install -g` ！这会导致后续所有 `openclaw` 命令都需要 `sudo` ，埋下巨大安全隐患。
阿里云部署后，浏览器打不开 `http://IP:18789`	防火墙规则未生效，或服务器内部 `ufw` 未启用	双保险检查：1. 在阿里云控制台，确认防火墙规则状态为“已启用”；2. SSH 登录服务器，执行 `sudo ufw status` ，确认 `18789` 端口状态为 `ALLOW` 。如果 `ufw` 是 `inactive` ，执行 `sudo ufw enable` 。	阿里云的“一键放通”只是帮你添加了云防火墙规则，但服务器内部的 `ufw` 是另一层防护，两者必须同时开启。

5.2 Agent 管理阶段：从“Agent 不见了”到“机器人不说话”

问题现象	根本原因	一招制敌的解决方案	实操心得
`openclaw agents list` 显示空列表	Agent 创建时指定了错误的 `--workspace` 路径，或路径权限不足	根治方案：执行 `ls -la ~/.openclaw/` ，确认 `workspace-*` 文件夹存在且属主为你自己。如果属主是 `root` ，执行 `sudo chown -R $USER:$USER ~/.openclaw/` 。然后 `openclaw gateway restart` 。	`--workspace` 路径必须是绝对路径，且必须以 `~` 开头（代表家目录）。写成 `./workspace-code` 或 `workspace-code` ，都会导致 Agent 被创建到错误位置。
飞书机器人收到消息，但无任何回复	`bindings` 配置中的 `chat_id` 错误，或 `trigger` 触发词未匹配	秒级诊断：执行 `openclaw logs --follow` ，然后在飞书中发一条测试消息。如果日志中完全没有出现 `message_received` 字样，说明飞书 Webhook 未正确配置到 OpenClaw；如果日志中有 `message_received` ，但没有 `routing to agent` ，说明 `bindings` 匹配失败。	飞书的 `chat_id` 是动态的，重命名群聊、转移群主都可能导致 ID 变更。建议将 `chat_id` 的获取和配置，写成一个自动化脚本，定期检查。
`main` Agent 能响应，但 `code-helper` 不响应	`main` Agent 的 `bindings` 配置覆盖了所有群聊，导致子Agent的 `bindings` 无法生效	配置铁律： `main` Agent 的 `bindings` 必须限定为 `peer.kind: "user"` （私聊），绝不能配置为 `peer.kind: "group"` 。所有群聊的 `bindings` ，只配置给子Agent。	这是多Agent架构的基石逻辑： `main` 是指挥官，只接受“老板”的私聊指令；子Agent是士兵，只在各自的“战区”（群聊）里执行任务。指挥官和士兵不能抢同一个战场。

5.3 API 与模型阶段：从“401 Unauthorized”到“模型不响应”

问题现象	根本原因	一招制敌的解决方案	实操心得
调用模型时提示 `401 Unauthorized`	API Key 已过期，或 `region` 配置与 Key 创建地域不一致	精准定位：在阿里云百炼控制台，进入【API密钥管理】，找到你的 Key，点击【详情】，确认其状态为“启用”，并记下“地域”字段（如 `cn-beijing` ）。然后检查 `openclaw.json` 中的 `region` 字段是否完全一致（大小写、连字符都必须相同）。	百炼的 API Key 是地域绑定的。在北京创建的 Key，无法在杭州地域调用。这是最隐蔽的坑，因为错误信息只说 `401` ，从不提示“地域错误”。
配置 API 后， `openclaw agents list` 正常，但发消息无响应	`models.default.provider` 配置错误，或 `default` 模型未正确关联到 Agent	配置检查表：1. `openclaw.json` 中 `models.default.provider` 必须是 `alibaba-cloud` ；2. `models.default.model` 必须是 `glm-5` ；3. 每个 Agent 的 `--model` 参数，必须与 `models.default` 的值完全一致。三者缺一不可。	OpenClaw 的模型配置是“两级映射”：CLI 命令指定 Agent 用哪个“模型别名”， `openclaw.json` 将这个别名映射到真实的 Provider 和 Model ID。任何一级出错，都会导致链路中断。

5.4 高级技巧：让 AI 小队真正“活”起来

技能（Skill）共享 ：热词里有 openclaw 多agent 共享skill 。这指的是，你可以把一个通用的 Python 脚本（如 web_scrape.py ）放在 ~/.openclaw/skills/ 目录下，然后在 code-helper 和 researcher 的 workspace 中，都创建一个软链接 ln -s ~/.openclaw/skills/web_scrape.py ./skills/web_scrape.py 。这样，两个 Agent