关键词:小米MiMo、DeepSeek、大模型降价、AI价格战、Token Plan、API定价、MiMo-V2.5、DeepSeek-V4


今天 AI 圈最炸裂的新闻:**小米 MiMo-V2.5 系列 API 永久降价,最高降幅 99%**。

而 DeepSeek 此前已将 V4-Pro 调整为 2.5 折(原价的 1/4)。

小米跟进 DeepSeek 的降价策略,大模型价格战已经不是"谁更便宜"的问题了,而是"谁能让开发者用得起"的问题。

一、小米 MiMo 降价:到底降了多少?

具体定价(每百万 tokens)

模型 输入(缓存命中) 输入(未命中) 输出 上下文
MiMo-V2.5-Pro 0.025 元 3 元 6 元 1M
MiMo-V2.5 0.02 元 1 元 2 元 1M
MiMo-V2.5-TTS 系列 限时免费 8K

📌 TTS 系列包括:mimo-v2.5-ttsmimo-v2.5-tts-voiceclone(音色克隆)、mimo-v2.5-tts-voicedesign(音色设计),全部限时免费。

核心变化

变化 详情
API 降价 最高降幅 99%,永久生效
输入长度 不再区分输入长度,统一计价
Token Plan Credits 用量提升至 5-8 倍,不加价
百万亿 Token 计划 提前收官,100T Tokens 已全部发完
用户福利 现有 Token Plan 用户 Credits 全量重置

以下是小米官方调价公告截图:

Token Plan 的具体优化内容:

MiMo-V2.5 模型更新

小米之前已发布 MiMo-V2.5 系列三款模型,今天的重点是价格调整:

  • MiMo-V2.5-Pro:长程推理能力增强,Agent 效率更高,支持 1M 上下文

  • MiMo-V2.5:原生全模态,新增 1M 上下文窗口

  • MiMo-V2.5-TTS:音色克隆 + 细粒度指令控制

背后的技术优化

小米能降价 99%,不是亏本卖,而是推理效率提升了:

  • 基于 SGLang HiCache 完整支持 SWA(Sliding Window Attention)

  • KV Cache 多级存储搬运量降低至优化前的 1/7

  • 可缓存 token 数量提升至优化前的 近 5 倍

二、DeepSeek 的价格:目前什么水平?

DeepSeek V4 目前的价格(每百万 token):

模型 输入(缓存命中) 输入(缓存未命中) 输出 上下文
V4-Flash 0.02 元 1 元 2 元 1M
V4-Pro(限时 2.5 折) 0.025 元 3 元 6 元 1M
V4-Pro(原价) 0.10 元 12 元 24 元 1M

📌 重要提示

  • deepseek-chat 对应 V4-Flash 非思考模式,deepseek-reasoner 对应 V4-Flash 思考模式(未来将弃用旧名)

  • V4-Pro 的 2.5 折优惠将于 5 月 31 日 23:59 结束,届时正式调整为原定价的 1/4(即 0.025/3/6 成为永久价格)

  • 缓存命中价格于 2026/4/26 调整为首发价的 1/10

  • 输出长度上限均为 384K tokens

三、小米 vs DeepSeek:价格对比

对比维度 小米 MiMo-V2.5 DeepSeek V4
降价幅度 最高 99%,永久生效 Flash 极低价,Pro 原价 1/4 永久生效
标准级别定价 0.02/1/2(1M) 0.02/1/2(1M)
Pro 级别定价 0.025/3/6(1M) 0.025/3/6(1M,5/31 后正式定价)
输入长度 不区分,统一计价 不区分
上下文窗口 1M 1M
输出长度上限 128K 384K
思考模式 支持 支持
多模态 原生全模态 支持
TTS 语音合成 MiMo-V2.5-TTS(限时免费)
Token Plan 加量 5-8 倍
降价节奏 一步到位永久降价 5/31 后 Pro 正式调整为原价 1/4

核心差异

  1. 定价几乎一模一样:V2.5 和 V4-Flash 都是 0.02/1/2,V2.5-Pro 和 V4-Pro 都是 0.025/3/6 —— 已经卷到同一价格线了

  2. 两家都是永久降价:小米一步到位,DeepSeek 5/31 后 Pro 也正式锁定为原价 1/4

  3. 小米有 TTS:MiMo-V2.5-TTS 支持音色克隆,这是 DeepSeek 没有的

  4. DeepSeek 输出更长:384K vs 128K,长文本生成更有优势

四、大模型价格战的本质

为什么都在降价?

推理成本下降 → 降价空间出现 → 抢占开发者 → 生态锁定

小米和 DeepSeek 的逻辑一样:先用低价把开发者圈进来,再靠生态赚钱。

对开发者的利好

利好 说明
成本降低 API 调用成本大幅下降,创业公司也能用得起
选择增多 不再只有 OpenAI/Anthropic,国产模型越来越好
功能增强 降价的同时模型能力还在提升
竞争加剧 倒逼所有厂商持续优化

潜在风险

风险 说明
持续性存疑 降价是否能持续?亏本卖能撑多久?
质量隐患 降价后服务质量是否下降?
锁定效应 用惯了一个平台,迁移成本很高

五、开发者怎么选?

调 API 为主: 两家价格几乎一样,小米有 TTS 优势,DeepSeek 输出更长(384K)

做 Agent 开发: MiMo-V2.5-Pro Agent 能力更强,DeepSeek Tool Calls 更成熟

预算有限: 小米 Token Plan 加量 5-8 倍适合长期,DeepSeek Flash 适合试水

一句话:两家价格已经卷到同一起跑线,都是永久降价,小米多一个 TTS 独有,开发者赢麻了。


相关链接:

  • 小米 MiMo 开放平台:https://platform.xiaomimimo.com/docs/zh-CN/news/v2.5-price-update

  • DeepSeek API 定价:https://api-docs.deepseek.com/zh-cn/quick_start/pricing

互动时间:你目前在用哪家的大模型 API?降价后会换吗?欢迎在评论区分享你的看法。

Logo

Agent 垂直技术社区,欢迎活跃、内容共建。

更多推荐