总结先行

  • 如果后期想用收费模型,首推硅基流动,活动多模型全。
  • 如果想用国外模型,网络不是问题,推荐OpenRouter。
  • 如果想完全白嫖,使用频率不是很高,并且能忍受有时候会请求超限,推荐七牛云(step-3.5-flash)、iflow、longcat(美团)。
  • 如果对自建知识库有兴趣,推荐模力方舟的向量和排序模型(需要先充10块钱)

各家模型OpenClaw表现排行

https://pinchbench.com

  • 按此排名,结合本文中各家提供的模型,比较推荐的性价比模型:

    • z-ai/glm-4.5-air
    • stepfun/step-3.5-flash
    • deepseek/deepseek-v3.2
    • qwen/qwen3-coder

硅基流动

https://cloud.siliconflow.cn/i/lduUVPFV

  • 特点:活动多模型全,速率限制清晰,从推广链接进去注册送16块,3月份还有活动再送18块。
  • 优势:范围广,免费模型多
  • 速率限制:每个模型不同,模型广场可查看,顶级模型基本在500/2000000(RPM/TPM),可惜stepfun-ai/Step-3.5-Flash速率是1000/10000
  • 推荐模型(按价格):Qwen/Qwen3.5-397B-A17B,deepseek-ai/DeepSeek-V3.2,Pro/MiniMaxAI/MiniMax-M2.5,Pro/zai-org/GLM-5,Pro/moonshotai/Kimi-K2.5,stepfun-ai/Step-3.5-Flash(最便宜)
  • 备注:tencent/Hunyuan-MT-7B用来翻译不错,Kwai-Kolors/Kolors免费生图模型
  • API端点:https://api.siliconflow.cn/v1

七牛云

https://www.qiniu.com/ai/promotion/invited?cps_key=1hbic8ii6uqtu

  • 特点:注册即送token,token是按倍率计算
  • 优势:推广链接注册,可送1300W token,step-3.5-flash免费,日志查看不错
  • 推荐免费模型:stepfun/step-3.5-flash,arcee-ai/trinity-large-preview(海外)
  • 速率限制:未知,实测agent任务会触发429,有时候会502
  • 备注:平台模型和官方可能会有区别,有些原生支持工具、思考等这里可能不支持,模型广场卡片可以看到每个模型详情
  • API端点:https://api.qnaigc.com/v1
  • API端点(海外):https://openai.sufy.com/v1

OpenRouter

https://openrouter.ai

  • 特点:模型最全,国内外定级模型都有
  • 优点:免费模型多,openrouter/free有自动路由免费模型功能
  • 速率限制:未充值账户20 RPM,10美元以下50 RPM,10美元以上1000 RPM,会有8%手续费,支持微信支付
  • 推荐免费模型:stepfun/step-3.5-flash:free,arcee-ai/trinity-large-preview:free,z-ai/glm-4.5-air:free
  • 备注:有些地区可能网络访问有问题
  • API端点:https://openrouter.ai/api/v1

iFlow

注:4月份下线
https://platform.iflow.cn

  • 特点:阿里旗下CLI工具,模型主要是Kimi-K2、Qwen3、DeepSeek等上代模型,只支持chat/completions接口
  • 优势:完全免费
  • 请求速率限制:小于等于60 RPM
  • 推荐免费模型:DeepSeek-V3.2-Exp、kimi-k2-0905、qwen3-max、qwen3-coder-plus(代码)、qwen3-vl-plus(多模态)
  • 备注:还未测试,效果未知
  • API端点:https://apis.iflow.cn/v1

模力方舟

https://ai.gitee.com/serverless-api

  • 特点:国产算力部署
  • 优势:免费模型范围广,向量模型,排序模型,ASR,TTS模型均有免费可选
  • 请求速率限制:未知
  • 推荐免费模型:GLM-4.7-Flash
  • 备注:需要充10块钱才能使用
  • API端点:https://ai.gitee.com/v1

Longcat(美团)

https://longcat.chat/platform

  • 特点:完全免费
  • 优点:量大管饱,每天500万 token(需要发下申请,默认是50万)+500lite模型token
  • 速率限制:未知
  • 推荐模型:LongCat-Flash-Thinking-2601
  • 备注:他家模型调用工具标签比较特殊,带有longcat tool,nanobot实测有时候会抽风。用来做翻译效果不错。
  • API端点:https://api.longcat.chat/openai/v1

Modelscope

https://www.modelscope.cn

  • 可以调用Qwen,kimi,minimax,但是大型模型调用次数一天可能就100次,共计2000次一天。
  • API端点:https://api-inference.modelscope.cn/v1

ModelScope 模型限额测试报告

序号 模型 状态 用户总限额 模型限额
1 ZhipuAI/GLM-4.7-Flash ✅ 成功 2000 100
2 XiaomiMiMo/MiMo-V2-Flash ✅ 成功 2000 100
3 Qwen/Qwen3.5-397B-A17B ✅ 成功 2000 100
4 Qwen/Qwen3.5-122B-A10B ✅ 成功 2000 200
5 Qwen/Qwen3.5-27B ✅ 成功 2000 500
6 MiniMax/MiniMax-M2.5 ✅ 成功 2000 100
7 moonshotai/Kimi-K2.5 ✅ 成功 2000 50
8 stepfun-ai/Step-3.5-Flash ✅ 成功 2000 500
9 deepseek-ai/DeepSeek-V3.2 ✅ 成功 2000 20

阿里百炼

https://bailian.console.aliyun.com

  • 注册有免费额度,每个模型基本上是100万,但是容易超出了被反薅。
  • API端点:https://dashscope.aliyuncs.com/compatible-mode/v1

高级技巧

通过部署LiteLLM或者Bifrost或者Higress实现模型智能路由,整合资源,实现根据报错、token超限等条件自动切换。有兴趣后面可以写写。

Logo

Agent 垂直技术社区,欢迎活跃、内容共建。

更多推荐