如何把本地模型接入Openclaw或Hermes Agent详细教程

Tp_jh

382人浏览 · 2026-05-12 18:17:06

Tp_jh · 2026-05-12 18:17:06 发布

随着openclaw、Hermes、codex、Claude code等Agent产品的持续爆火，大家开始对token、算力有了具象化的理解，各大模型云服务厂商也纷纷推出自己的coding plan搞促销，算力从以前的无人问津变得门庭若市，连某国总统都下场做中转站了。不过目前的算力需求依旧是供大于求了，不少大模型的用户都有明显感觉降智或者限速，所以真正想实现token的自由，本地跑模型也是一种满足大家对算力要求的方式，这篇文章我就分享一下如何实现token自由，也就是0 token养虾或者养马。

windows系统如何运行大模型？

我相信对于很多技术小白而言用的设备多是windows系统，所以这篇文章分享的就是在windows系统跑大模型，实现本地0 token使用openclaw、Hermes。

首先打开牧马人本地推理引擎（Herdsman）官网，一键下载牧马人

下载以后直接打开就行，牧马人是个免安装的应用程序

打开牧马人以后会有个新手引导，大家可以简单看看，然后先打开设置

设置数据目录以及存储目录，尽量把这两个目录位置都设置为D盘，因为每个模型动则10几个GB，很容易导致C盘爆满（如果您只有C盘可以直接忽略）

打开模型区域，牧马人根据使用场景需求把模型做了分类，比如您是想简单的对话聊天就用智能对话下的模型，点击一键下载即可

如果你有生成图片的需求就选对应的生图模型，如z-image、qwen-image-edit-2511

虚拟人物对话就是和机器人聊天，谈一个“AI对象”

翻译专用模型，如混元

下载好的模型，一键启动，启动的时候上下文尽量拉到最长，开启思考模式

模型启动以后便可以回到应用界面进行对话，提需求了

还可以查看输入输出的token速度，我的硬件配置是i5的14代处理器以及英伟达4050显卡，32G内存，token输出速度大概10t/s,个人觉得这速度我还能接受

如何把本地模型接入openclaw和Hermes agent？

模型已经准备好了，也就是本地有算力，接下来就是把算力分配给其他应用进行使用，打开FlowyAIPC官网,下载安装FlowyAIPC，安装过程就不展示了，和安装其他windows软件没有区别

打开FlowyAIPC，在顶部的模型选择区域选择本地模型，便可以进行操作了

在这里，本地模型和云端模型的区别只有快慢，至于操作范围，云端模型能完成，本地也能完成，操作本地文件，在网上收集数据，写文章，自动化运营都可以完成，比如我让他帮我收集昨天AI圈的新闻

还有编辑文章保存到公众号并发布

FlowyAIPC就是一个基于Openclaw打造的桌面AI助手，跟openclaw对比就是对技术小白用户更友好，不需要配置环境，不需要API Key，做到了真正的开箱即用。

AI Agent技术社区

Agent 垂直技术社区，欢迎活跃、内容共建。

更多推荐

ChatGPT 5.5 辅助测试用例生成实践：从支付回调接口到可验证的研发流程

AI Agent技术社区

2026年如何用Gemini镜像站辅助学术写作？

把Gemini融入学术写作流程，能从文献处理、初稿打磨到格式校对等环节释放大量时间。对于国内研究者，选择像RskAi这样无需复杂网络配置、集成多款先进模型的镜像服务，让技术直接服务研究思维。想一站式体验不同模型在学术辅助上的侧重，可以访问，从一个小任务开始，逐步建立自己的AI辅助写作方法。【本文完】

AI Agent技术社区

AI 中转站：企业大模型应用中容易被忽视的安全关键点

2026年3月，墨西哥三人初创团队遭遇AI密钥盗用危机，团队月度常规Google Cloud费用仅180美元，攻击者盗取Gemini关联API密钥后，48小时疯狂调用模型接口，产生82314.44美元（约56.8万元）账单，费用暴涨近455倍，远超企业账户流动资金，团队濒临破产。此次事件叠加多重隐患：API密钥权限自动扩张、平台无异常调用风控告警、密钥缺少分级隔离，且企业全量AI模型调用流量，缺少