openclaw 免费大模型调用推荐-3月更新

iduzy

966人浏览 · 2026-03-11 10:23:57

iduzy · 2026-03-11 10:23:57 发布

总结先行

如果后期想用收费模型，首推硅基流动，活动多模型全。
如果想用国外模型，网络不是问题，推荐OpenRouter。
如果想完全白嫖，使用频率不是很高，并且能忍受有时候会请求超限，推荐七牛云（step-3.5-flash）、iflow、longcat（美团）。
如果对自建知识库有兴趣，推荐模力方舟的向量和排序模型（需要先充10块钱）

各家模型OpenClaw表现排行

https://pinchbench.com

按此排名，结合本文中各家提供的模型，比较推荐的性价比模型：
- z-ai/glm-4.5-air
- stepfun/step-3.5-flash
- deepseek/deepseek-v3.2
- qwen/qwen3-coder

硅基流动

https://cloud.siliconflow.cn/i/lduUVPFV

特点：活动多模型全，速率限制清晰，从推广链接进去注册送16块，3月份还有活动再送18块。
优势：范围广，免费模型多
速率限制：每个模型不同，模型广场可查看，顶级模型基本在500/2000000(RPM/TPM),可惜stepfun-ai/Step-3.5-Flash速率是1000/10000
推荐模型（按价格）：Qwen/Qwen3.5-397B-A17B，deepseek-ai/DeepSeek-V3.2，Pro/MiniMaxAI/MiniMax-M2.5，Pro/zai-org/GLM-5，Pro/moonshotai/Kimi-K2.5，stepfun-ai/Step-3.5-Flash（最便宜）
备注：tencent/Hunyuan-MT-7B用来翻译不错，Kwai-Kolors/Kolors免费生图模型
API端点：https://api.siliconflow.cn/v1

七牛云

https://www.qiniu.com/ai/promotion/invited?cps_key=1hbic8ii6uqtu

特点：注册即送token，token是按倍率计算
优势：推广链接注册，可送1300W token，step-3.5-flash免费，日志查看不错
推荐免费模型：stepfun/step-3.5-flash，arcee-ai/trinity-large-preview（海外）
速率限制：未知，实测agent任务会触发429，有时候会502
备注：平台模型和官方可能会有区别，有些原生支持工具、思考等这里可能不支持，模型广场卡片可以看到每个模型详情
API端点：https://api.qnaigc.com/v1
API端点(海外)：https://openai.sufy.com/v1

OpenRouter

https://openrouter.ai

特点：模型最全，国内外定级模型都有
优点：免费模型多，openrouter/free有自动路由免费模型功能
速率限制：未充值账户20 RPM，10美元以下50 RPM，10美元以上1000 RPM，会有8%手续费，支持微信支付
推荐免费模型：stepfun/step-3.5-flash:free，arcee-ai/trinity-large-preview:free，z-ai/glm-4.5-air:free
备注：有些地区可能网络访问有问题
API端点：https://openrouter.ai/api/v1

iFlow

注：4月份下线
https://platform.iflow.cn

特点：阿里旗下CLI工具，模型主要是Kimi-K2、Qwen3、DeepSeek等上代模型，只支持chat/completions接口
优势：完全免费
请求速率限制：小于等于60 RPM
推荐免费模型：DeepSeek-V3.2-Exp、kimi-k2-0905、qwen3-max、qwen3-coder-plus（代码）、qwen3-vl-plus（多模态）
备注：还未测试，效果未知
API端点：https://apis.iflow.cn/v1

模力方舟

https://ai.gitee.com/serverless-api

特点：国产算力部署
优势：免费模型范围广，向量模型，排序模型，ASR，TTS模型均有免费可选
请求速率限制：未知
推荐免费模型：GLM-4.7-Flash
备注：需要充10块钱才能使用
API端点：https://ai.gitee.com/v1

Longcat（美团）

https://longcat.chat/platform

特点：完全免费
优点：量大管饱，每天500万 token(需要发下申请，默认是50万)+500lite模型token
速率限制：未知
推荐模型：LongCat-Flash-Thinking-2601
备注：他家模型调用工具标签比较特殊，带有longcat tool，nanobot实测有时候会抽风。用来做翻译效果不错。
API端点：https://api.longcat.chat/openai/v1

Modelscope

https://www.modelscope.cn

可以调用Qwen，kimi，minimax，但是大型模型调用次数一天可能就100次，共计2000次一天。
API端点：https://api-inference.modelscope.cn/v1

ModelScope 模型限额测试报告

序号	模型	状态	用户总限额	模型限额
1	ZhipuAI/GLM-4.7-Flash	✅ 成功	2000	100
2	XiaomiMiMo/MiMo-V2-Flash	✅ 成功	2000	100
3	Qwen/Qwen3.5-397B-A17B	✅ 成功	2000	100
4	Qwen/Qwen3.5-122B-A10B	✅ 成功	2000	200
5	Qwen/Qwen3.5-27B	✅ 成功	2000	500
6	MiniMax/MiniMax-M2.5	✅ 成功	2000	100
7	moonshotai/Kimi-K2.5	✅ 成功	2000	50
8	stepfun-ai/Step-3.5-Flash	✅ 成功	2000	500
9	deepseek-ai/DeepSeek-V3.2	✅ 成功	2000	20

阿里百炼

https://bailian.console.aliyun.com

注册有免费额度，每个模型基本上是100万，但是容易超出了被反薅。
API端点：https://dashscope.aliyuncs.com/compatible-mode/v1

高级技巧

通过部署LiteLLM或者Bifrost或者Higress实现模型智能路由，整合资源，实现根据报错、token超限等条件自动切换。有兴趣后面可以写写。

AI Agent技术社区

Agent 垂直技术社区，欢迎活跃、内容共建。

更多推荐

Dify 接入蓝耘 MaaS：基于智能客服分流模板搭建一个客服助手

AI Agent技术社区

2026年企业级大模型API聚合平台选型指南：协议兼容、稳定性与治理能力深度解析

因此，在企业级场景下，选择合适的API聚合平台已经不再只是采购问题，而是一项长期架构决策。| 平台| 模型覆盖规模 | 协议兼容能力| 生产稳定性| 企业管理能力| 成本管理特点| 适用场景|| 星链4SAPI| 480+| OpenAI、Anthropic、Gemini原生兼容 | 企业级可用性设计 | 多账号、审计、额度管理 | 提供细粒度Token统计 | 多模型生产环境|