openclaw 免费大模型调用推荐-3月更新
·
总结先行
- 如果后期想用收费模型,首推硅基流动,活动多模型全。
- 如果想用国外模型,网络不是问题,推荐OpenRouter。
- 如果想完全白嫖,使用频率不是很高,并且能忍受有时候会请求超限,推荐七牛云(step-3.5-flash)、iflow、longcat(美团)。
- 如果对自建知识库有兴趣,推荐模力方舟的向量和排序模型(需要先充10块钱)
各家模型OpenClaw表现排行
https://pinchbench.com
-
按此排名,结合本文中各家提供的模型,比较推荐的性价比模型:
z-ai/glm-4.5-airstepfun/step-3.5-flashdeepseek/deepseek-v3.2qwen/qwen3-coder
硅基流动
https://cloud.siliconflow.cn/i/lduUVPFV
- 特点:活动多模型全,速率限制清晰,从推广链接进去注册送16块,3月份还有活动再送18块。
- 优势:范围广,免费模型多
- 速率限制:每个模型不同,模型广场可查看,顶级模型基本在500/2000000(RPM/TPM),可惜stepfun-ai/Step-3.5-Flash速率是1000/10000
- 推荐模型(按价格):Qwen/Qwen3.5-397B-A17B,deepseek-ai/DeepSeek-V3.2,Pro/MiniMaxAI/MiniMax-M2.5,Pro/zai-org/GLM-5,Pro/moonshotai/Kimi-K2.5,stepfun-ai/Step-3.5-Flash(最便宜)
- 备注:tencent/Hunyuan-MT-7B用来翻译不错,Kwai-Kolors/Kolors免费生图模型
- API端点:
https://api.siliconflow.cn/v1
七牛云
https://www.qiniu.com/ai/promotion/invited?cps_key=1hbic8ii6uqtu
- 特点:注册即送token,token是按倍率计算
- 优势:推广链接注册,可送1300W token,step-3.5-flash免费,日志查看不错
- 推荐免费模型:stepfun/step-3.5-flash,arcee-ai/trinity-large-preview(海外)
- 速率限制:未知,实测agent任务会触发429,有时候会502
- 备注:平台模型和官方可能会有区别,有些原生支持工具、思考等这里可能不支持,模型广场卡片可以看到每个模型详情
- API端点:
https://api.qnaigc.com/v1 - API端点(海外):
https://openai.sufy.com/v1
OpenRouter
https://openrouter.ai
- 特点:模型最全,国内外定级模型都有
- 优点:免费模型多,openrouter/free有自动路由免费模型功能
- 速率限制:未充值账户20 RPM,10美元以下50 RPM,10美元以上1000 RPM,会有8%手续费,支持微信支付
- 推荐免费模型:stepfun/step-3.5-flash:free,arcee-ai/trinity-large-preview:free,z-ai/glm-4.5-air:free
- 备注:有些地区可能网络访问有问题
- API端点:
https://openrouter.ai/api/v1
iFlow
注:4月份下线
https://platform.iflow.cn
- 特点:阿里旗下CLI工具,模型主要是Kimi-K2、Qwen3、DeepSeek等上代模型,只支持
chat/completions接口 - 优势:完全免费
- 请求速率限制:小于等于60 RPM
- 推荐免费模型:DeepSeek-V3.2-Exp、kimi-k2-0905、qwen3-max、qwen3-coder-plus(代码)、qwen3-vl-plus(多模态)
- 备注:还未测试,效果未知
- API端点:
https://apis.iflow.cn/v1
模力方舟
https://ai.gitee.com/serverless-api
- 特点:国产算力部署
- 优势:免费模型范围广,向量模型,排序模型,ASR,TTS模型均有免费可选
- 请求速率限制:未知
- 推荐免费模型:GLM-4.7-Flash
- 备注:需要充10块钱才能使用
- API端点:
https://ai.gitee.com/v1
Longcat(美团)
https://longcat.chat/platform
- 特点:完全免费
- 优点:量大管饱,每天500万 token(需要发下申请,默认是50万)+500lite模型token
- 速率限制:未知
- 推荐模型:LongCat-Flash-Thinking-2601
- 备注:他家模型调用工具标签比较特殊,带有longcat tool,nanobot实测有时候会抽风。用来做翻译效果不错。
- API端点:
https://api.longcat.chat/openai/v1
Modelscope
https://www.modelscope.cn
- 可以调用Qwen,kimi,minimax,但是大型模型调用次数一天可能就100次,共计2000次一天。
- API端点:
https://api-inference.modelscope.cn/v1
ModelScope 模型限额测试报告
| 序号 | 模型 | 状态 | 用户总限额 | 模型限额 |
|---|---|---|---|---|
| 1 | ZhipuAI/GLM-4.7-Flash | ✅ 成功 | 2000 | 100 |
| 2 | XiaomiMiMo/MiMo-V2-Flash | ✅ 成功 | 2000 | 100 |
| 3 | Qwen/Qwen3.5-397B-A17B | ✅ 成功 | 2000 | 100 |
| 4 | Qwen/Qwen3.5-122B-A10B | ✅ 成功 | 2000 | 200 |
| 5 | Qwen/Qwen3.5-27B | ✅ 成功 | 2000 | 500 |
| 6 | MiniMax/MiniMax-M2.5 | ✅ 成功 | 2000 | 100 |
| 7 | moonshotai/Kimi-K2.5 | ✅ 成功 | 2000 | 50 |
| 8 | stepfun-ai/Step-3.5-Flash | ✅ 成功 | 2000 | 500 |
| 9 | deepseek-ai/DeepSeek-V3.2 | ✅ 成功 | 2000 | 20 |
阿里百炼
https://bailian.console.aliyun.com
- 注册有免费额度,每个模型基本上是100万,但是容易超出了被反薅。
- API端点:
https://dashscope.aliyuncs.com/compatible-mode/v1
高级技巧
通过部署LiteLLM或者Bifrost或者Higress实现模型智能路由,整合资源,实现根据报错、token超限等条件自动切换。有兴趣后面可以写写。
更多推荐

所有评论(0)