你用的是 Qwen2.5:0.8b 这种极小模型,但一接 OpenClaw 就卡死,核心原因只有一个:

🚨 根本原因

OpenClaw 强制把上下文拉到 ≥16000 token + 无限历史 + Agent 调度 + 转发开销

  • 直接 Ollama:num_ctx=4096,轻量流畅
  • OpenClaw 对接:强制 16384 上下文 + 全量历史 + 思考/工具调度
    显存/内存瞬间爆、KV Cache 暴涨、CPU 满载、电脑卡死

一、先看你那行报错(关键)

lane task error: ... FailoverError: Model context window too small (8192 tokens). Minimum is 16000.
  • OpenClaw 最低要求 16000 token 上下文
  • 你设 8192 → 不满足 → 无限重试、切换、重载模型 → 卡死

二、0.8b 为什么更卡(比 0.5b 还严重)

Qwen2.5:0.8b 本身很小,但:

  • num_ctx=16384 → KV 缓存 = 16384 × 0.8b ≈ 巨大
  • OpenClaw 还要:
    • 完整历史(每轮都发)
    • 工具调用、思考步骤、日志、转发
    • 并发、心跳、监控
      0.8b 扛不住这种调度 overhead → 电脑直接卡死

三、立刻救电脑(按顺序做)

1. 强制上下文:16384(满足最低,但别再大)

Ollama 端(必须)

ollama run qwen2.5:0.8b
/set parameter num_ctx 16384
/exit

2. OpenClaw 配置(最关键)

打开:

  • Windows: %APPDATA%\openclaw\providers\ollama.json
  • Linux/macOS: ~/.openclaw/providers/ollama.json

改成这样(直接复制)

{
  "provider": "ollama",
  "model": "qwen2.5:0.8b",
  "baseUrl": "http://localhost:11434",
  "options": {
    "num_ctx": 16384,
    "num_gpu": 99,
    "temperature": 0.7,
    "keep_alive": "24h",
    "num_batch": 32,
    "num_thread": 2
  },
  "timeoutSeconds": 30,
  "maxHistoryTurns": 3
}
  • num_gpu=99:全 GPU 加速(别用 CPU)
  • maxHistoryTurns=3:只保留 3 轮历史(救命)
  • num_thread=2:限制 CPU 线程(防 100%)

3. 开启 OpenClaw 轻量化模式(必开)

打开主配置:

  • Windows: %APPDATA%\openclaw\openclaw.json
  • Linux/macOS: ~/.openclaw/openclaw.json

添加:

{
  "lite_mode": true,
  "gateway": {
    "lightweight": true
  },
  "skills": {
    "max_concurrent": 1
  }
}
  • lite_mode: true:关闭所有非核心组件
  • max_concurrent: 1:只允许 1 个任务(防并发卡死)

4. Ollama 保活 + 驻留显存(防反复加载)

Windows(管理员终端)

set OLLAMA_KEEP_ALIVE=-1
set OLLAMA_NUM_GPU=99
set OLLAMA_NOPRUNE=1
ollama stop
ollama start

Linux/macOS

export OLLAMA_KEEP_ALIVE=-1
export OLLAMA_NUM_GPU=99
export OLLAMA_NOPRUNE=1
ollama stop
ollama serve

5. 关闭 OpenClaw 所有多余功能

在 OpenClaw 面板:

  • 关闭 工具调用、联网搜索、文件读取、代码执行
  • 关闭 思考过程(Thinking) 显示
  • 关闭 长文档、知识库、RAG 功能
  • 只用 纯聊天模式

四、验证是否正常

  1. 重启 OpenClaw
  2. 发一句简单问题
  3. 看任务管理器:
    • GPU 占用:30–70%(正常)
    • CPU 占用:≤ 50%
    • 内存:≤ 8GB

五、0.8b 终极底线配置(低配电脑必用)

{
  "provider": "ollama",
  "model": "qwen2.5:0.8b",
  "options": {
    "num_ctx": 16384,
    "num_gpu": 99,
    "keep_alive": "24h",
    "num_batch": 16,
    "num_thread": 1
  },
  "maxHistoryTurns": 2
}
  • num_thread: 1:单核运行(最稳)
  • maxHistoryTurns: 2:只留 2 轮历史

✅ 一句话总结

OpenClaw 强制 16k 上下文 + 无限历史 + Agent 调度,把 0.8b 压垮。按上面配置:轻量化 + 限历史 + 驻留显存,电脑立刻不卡。

Logo

Agent 垂直技术社区,欢迎活跃、内容共建。

更多推荐