小米 MiMo-V2.5 vs DeepSeek V4 定价全对比：0.02 元/M 起，你选谁？

摘要：小米MiMo-V2.5系列API宣布永久降价，最高降幅达99%，与DeepSeek-V4的降价策略形成直接竞争。两者核心模型价格趋同（如0.02/1/2元每百万tokens），但小米新增免费TTS语音克隆功能，DeepSeek则支持更长文本输出（384K）。价格战背后是推理效率提升（如小米采用SGLang优化技术）和生态争夺，开发者成为最大受益者。小米通过TokenPlan加量5-8倍吸引

hanzhixintianxia

791人浏览 · 2026-05-27 21:09:08

hanzhixintianxia · 2026-05-27 21:09:08 发布

关键词：小米MiMo、DeepSeek、大模型降价、AI价格战、Token Plan、API定价、MiMo-V2.5、DeepSeek-V4

今天 AI 圈最炸裂的新闻：**小米 MiMo-V2.5 系列 API 永久降价，最高降幅 99%**。

而 DeepSeek 此前已将 V4-Pro 调整为 2.5 折（原价的 1/4）。

小米跟进 DeepSeek 的降价策略，大模型价格战已经不是"谁更便宜"的问题了，而是"谁能让开发者用得起"的问题。

一、小米 MiMo 降价：到底降了多少？

具体定价（每百万 tokens）

模型	输入（缓存命中）	输入（未命中）	输出	上下文
MiMo-V2.5-Pro	0.025 元	3 元	6 元	1M
MiMo-V2.5	0.02 元	1 元	2 元	1M
MiMo-V2.5-TTS 系列	限时免费	—	—	8K

📌 TTS 系列包括：mimo-v2.5-tts、mimo-v2.5-tts-voiceclone（音色克隆）、mimo-v2.5-tts-voicedesign（音色设计），全部限时免费。

核心变化

变化	详情
API 降价	最高降幅 99%，永久生效
输入长度	不再区分输入长度，统一计价
Token Plan	Credits 用量提升至 5-8 倍，不加价
百万亿 Token 计划	提前收官，100T Tokens 已全部发完
用户福利	现有 Token Plan 用户 Credits 全量重置

以下是小米官方调价公告截图：

Token Plan 的具体优化内容：

MiMo-V2.5 模型更新

小米之前已发布 MiMo-V2.5 系列三款模型，今天的重点是价格调整：

MiMo-V2.5-Pro：长程推理能力增强，Agent 效率更高，支持 1M 上下文
MiMo-V2.5：原生全模态，新增 1M 上下文窗口
MiMo-V2.5-TTS：音色克隆 + 细粒度指令控制

背后的技术优化

小米能降价 99%，不是亏本卖，而是推理效率提升了：

基于 SGLang HiCache 完整支持 SWA（Sliding Window Attention）
KV Cache 多级存储搬运量降低至优化前的 1/7
可缓存 token 数量提升至优化前的 近 5 倍

二、DeepSeek 的价格：目前什么水平？

DeepSeek V4 目前的价格（每百万 token）：

模型	输入（缓存命中）	输入（缓存未命中）	输出	上下文
V4-Flash	0.02 元	1 元	2 元	1M
V4-Pro（限时 2.5 折）	0.025 元	3 元	6 元	1M
V4-Pro（原价）	0.10 元	12 元	24 元	1M

📌 重要提示：

deepseek-chat 对应 V4-Flash 非思考模式，deepseek-reasoner 对应 V4-Flash 思考模式（未来将弃用旧名）

V4-Pro 的 2.5 折优惠将于 5 月 31 日 23:59 结束，届时正式调整为原定价的 1/4（即 0.025/3/6 成为永久价格）

缓存命中价格于 2026/4/26 调整为首发价的 1/10

输出长度上限均为 384K tokens

三、小米 vs DeepSeek：价格对比

对比维度	小米 MiMo-V2.5	DeepSeek V4
降价幅度	最高 99%，永久生效	Flash 极低价，Pro 原价 1/4 永久生效
标准级别定价	0.02/1/2（1M）	0.02/1/2（1M）
Pro 级别定价	0.025/3/6（1M）	0.025/3/6（1M，5/31 后正式定价）
输入长度	不区分，统一计价	不区分
上下文窗口	1M	1M
输出长度上限	128K	384K
思考模式	支持	支持
多模态	原生全模态	支持
TTS 语音合成	MiMo-V2.5-TTS（限时免费）	无
Token Plan	加量 5-8 倍	无
降价节奏	一步到位永久降价	5/31 后 Pro 正式调整为原价 1/4

核心差异：

定价几乎一模一样：V2.5 和 V4-Flash 都是 0.02/1/2，V2.5-Pro 和 V4-Pro 都是 0.025/3/6 —— 已经卷到同一价格线了
两家都是永久降价：小米一步到位，DeepSeek 5/31 后 Pro 也正式锁定为原价 1/4
小米有 TTS：MiMo-V2.5-TTS 支持音色克隆，这是 DeepSeek 没有的
DeepSeek 输出更长：384K vs 128K，长文本生成更有优势

四、大模型价格战的本质

为什么都在降价？

推理成本下降 → 降价空间出现 → 抢占开发者 → 生态锁定

小米和 DeepSeek 的逻辑一样：先用低价把开发者圈进来，再靠生态赚钱。

对开发者的利好

利好	说明
成本降低	API 调用成本大幅下降，创业公司也能用得起
选择增多	不再只有 OpenAI/Anthropic，国产模型越来越好
功能增强	降价的同时模型能力还在提升
竞争加剧	倒逼所有厂商持续优化

潜在风险

风险	说明
持续性存疑	降价是否能持续？亏本卖能撑多久？
质量隐患	降价后服务质量是否下降？
锁定效应	用惯了一个平台，迁移成本很高

五、开发者怎么选？

调 API 为主： 两家价格几乎一样，小米有 TTS 优势，DeepSeek 输出更长（384K）

做 Agent 开发： MiMo-V2.5-Pro Agent 能力更强，DeepSeek Tool Calls 更成熟

预算有限： 小米 Token Plan 加量 5-8 倍适合长期，DeepSeek Flash 适合试水

一句话：两家价格已经卷到同一起跑线，都是永久降价，小米多一个 TTS 独有，开发者赢麻了。

相关链接：

小米 MiMo 开放平台：https://platform.xiaomimimo.com/docs/zh-CN/news/v2.5-price-update
DeepSeek API 定价：https://api-docs.deepseek.com/zh-cn/quick_start/pricing

互动时间：你目前在用哪家的大模型 API？降价后会换吗？欢迎在评论区分享你的看法。

AI Agent技术社区

Agent 垂直技术社区，欢迎活跃、内容共建。

更多推荐

让 Codex 桌面版拥抱 DeepSeek-V4：协议桥接与模型网关接入实践

4SAPI 提供了一套标准的 Chat Completions 接口，完全兼容 DeepSeek V4 Pro 等模型，使用时只需将 base URL 和密钥替换为平台分配的值即可。这样一来，既保留了桥接层的协议转换能力，又获得了网关带来的额外弹性。这样的模型网关，则进一步提升了链路的稳定性和密钥管理的便捷度，尤其适合团队或对服务可用性有更高要求的场景。│Codex 桌面版│ ──────────

AI Agent技术社区

别再迷信“突破限制”：Gemini 3.5-flash 边界测试实战复盘

AI Agent技术社区

想要转型AI Agent开发？现在开始学，还不晚

用 @tool 装饰器定义工具@tool"""搜索互联网获取实时信息。当需要最新数据时使用此工具。"""# 实际接入 Tavily / Serper 等搜索 APIreturnf"搜索结果：关于 {query} 的最新信息..."@tool"""计算数学表达式，如 '2 + 3 * 4'"""# 绑定工具到模型# 模型会自动决定是否调用工具response = llm_with_tools.inv