当 AI 行业还在争论 GPT-5.5 与 Claude Opus 谁的推理能力更强时,一组震撼数据已经颠覆认知:OpenRouter 平台上周处理28.9 万亿 Token,其中超 70% 的流量来自单价0.3 美元 / 百万 Token 以下的低价模型,国产模型 DeepSeek-V4-Flash 更是以绝对优势领跑调用榜。这场悄无声息的价格革命,正在彻底改写 AI 产业的成本逻辑与竞争格局。
相关深度分析可参考主题:OpenRouter 的价格真相:为什么最便宜的模型正在「统治」28.9T token?

一、28.9 万亿 Token 的真相:低价模型主导流量

OpenRouter 作为聚合 400 + 模型的 AI 路由平台,2026 年以来流量呈指数级增长:从年初的 5 万亿 Token / 周,飙升至如今的 28.9 万亿 Token / 周,半年内暴涨 5 倍,月流量突破 100 万亿 Token,全球用户超 800 万。

流量结构的变化更具颠覆性:

  • 低价模型垄断主流:DeepSeek、MiniMax、Qwen 等国产低价模型,单价仅为 GPT-4o 的 1/10-1/17,占据平台 70% 以上 Token 流量;

  • 免费模型成刚需:平台 30 + 免费模型覆盖 80% 简单任务,未充值用户每日可调用 50 次,充值 10 美元后每日免费调用量升至 1000 次,成为开发者调试首选;

  • 高价模型边缘化:GPT-5.5、Claude Opus 等旗舰模型仅在复杂推理场景使用,流量占比不足 10%,彻底告别 “全能垄断” 时代。

这组数据印证了核心结论:AI 市场已从 “能力优先” 转向 “成本优先”,最便宜的模型正在统治全球 Token 流量

二、价格雪崩的底层逻辑:国产模型重构成本底线

低价模型的爆发并非偶然,而是技术成熟、产能过剩与竞争白热化共同作用的结果,国产模型更是核心推手。

1. 技术突破:低价≠低能,性价比碾压高价模型

以 DeepSeek-V4-Flash 为代表的国产模型,通过架构优化、稀疏注意力与蒸馏技术,在保持核心能力的同时大幅降低推理成本:

  • DeepSeek-V4-Flash:输入仅 0.28 美元 / 百万 Token,支持 64K 上下文,代码与中文推理能力接近 GPT-4o,周调用量达 3.2 万亿 Token,稳居榜首;

  • Qwen3 系列:免费版支持 100 万 Token 上下文,简单任务性能超越 Llama-3,成为开发者 “白嫖” 首选;

  • MiniMax M2.5:输入 0.3 美元 / 百万 Token,长文本处理能力突出,企业批量任务首选。

2. 产能过剩:模型供给过剩,价格战不可避免

2025 年底至今,全球新增大模型超 200 个,仅国产模型就占 120+,而市场需求增速远低于供给增速。OpenRouter 数据显示,平台 400 + 模型中,仅前 20 名占据 90% 流量,中小模型为争夺份额主动降价,甚至推出永久免费版,直接击穿价格底线。

3. 场景分化:80% 任务无需旗舰模型,低价模型精准匹配

AI 应用场景已清晰分层:

  • 简单任务(80%):聊天、摘要、基础代码生成,低价 / 免费模型完全胜任;

  • 复杂任务(20%):科研推理、长文本分析、高精度代码开发,才需高价旗舰模型。

这种场景分化,让 “低价模型做主力、高价模型补短板” 成为行业共识,也直接推动低价模型统治流量。

三、OpenRouter 的盈利悖论:流量暴涨,利润微薄

OpenRouter 的估值神话(13 亿美元)完全建立在流量增长之上,但其盈利模式暗藏隐患。

1. 收入结构:靠通道费盈利,模型定价无 markup

OpenRouter 不赚取模型差价,仅在用户充值时收取5.5% 通道费(最低 0.8 美元),模型价格与官方直连完全一致。这种模式决定了:流量越大,收入越高,但利润空间极薄。2026 年初年化收入 5000 万美元,对应 13 亿美元估值,PS 倍数高达 26,远超 SaaS 行业平均水平。

2. 成本压力:低价模型拉低客单价,高并发场景利润被稀释

  • 客单价持续走低:低价模型主导流量后,用户平均账单从每月 50 美元降至 15 美元,通道费随之减少;

  • 高并发服务费叠加:月消耗超 10 万美元的企业用户,5.5% 通道费可达数千美元,反而高于官方直连阶梯折扣,导致大客户流失风险上升。

3. 核心价值:智能路由 + 统一接口,降本 70%-90%

尽管盈利模式存疑,但 OpenRouter 的核心价值不可替代:一个 API Key 统一调用 400 + 模型,智能路由自动匹配最优模型,企业实测可降低 70%-90% 推理成本。这种 “降本神器” 定位,让其成为 AI 基础设施的关键一环,也解释了资本为何愿意为流量买单。

四、行业启示:AI 定价革命,三类玩家将被重塑

1. 模型厂商:要么低价规模化,要么高价做专精

  • 大众市场:DeepSeek、Qwen 等国产模型已证明,低价 + 高性能 + 规模化是主流路径,未来价格战将进一步加剧;

  • 高端市场:GPT-5.5、Claude Opus 需聚焦科研、医疗、金融等高精度场景,放弃大众流量,靠高附加值盈利;

  • 中小厂商:无核心技术优势的模型将被淘汰,或沦为 OpenRouter 等平台的 “免费引流工具”。

2. 开发者 / 企业:成本优先,分层调用成标配

  • 个人开发者:优先使用免费模型完成调试,简单任务用低价模型,月成本可控制在 5 美元以内;

  • 中小企业:80% 任务用低价模型,20% 复杂任务用高价模型,整体成本降低 70%+;

  • 大型企业:自建模型集群 + OpenRouter 混合架构,核心数据私有部署,非核心任务走平台,平衡成本与安全。

3. 聚合平台:OpenRouter 模式不可复制,壁垒在数据与路由

OpenRouter 的核心壁垒不是模型数量,而是海量调用数据训练的智能路由算法—— 能根据任务类型、成本、延迟自动匹配最优模型,这是其他聚合平台短期内无法复制的。未来平台竞争将聚焦路由精度、稳定性与企业服务能力。

五、结语:AI 行业进入 “平价时代”

28.9 万亿 Token 的流量真相,本质是 AI 行业从 “技术稀缺” 到 “产能过剩” 的必然结果。最便宜的模型统治市场,不是行业倒退,而是成熟的标志——AI 终于从 “奢侈品” 变成 “日用品”,普惠化时代正式到来。

对开发者而言,这是最好的时代:极低的成本就能调用顶级模型,创新门槛大幅降低;对企业而言,降本增效不再是口号,而是可落地的现实;对行业而言,价格革命将加速淘汰落后产能,推动资源向优质模型与创新应用集中。

AI 的下一个十年,不再是 “谁的模型更强”,而是 “谁能以最低成本创造最大价值”。

要不要我为这篇文章生成 3 张适配博客排版的配图(封面图、数据可视化图、流程示意图)?

Logo

Agent 垂直技术社区,欢迎活跃、内容共建。

更多推荐