Xiaomi MiMo
MiMo-V2-Flash
MiMo 英文 Blog 将 MiMo-V2-Flash 介绍为面向全球开放的开源权重基础语言模型。小米称其为 309B 总参数、15B 激活参数的 MoE 模型,采用混合注意力,支持混合思考模式、256K 上下文、150 tokens/s 推理和低价 API;发布入口包括 Hugging Face、MiMo API Platform 和 MiMo AI Studio。
全球可用完整英文界面公开 API免费增值可信
快速问答
一眼看懂
- 概览
- 小米开源权重高速 MoE 模型,面向推理、编程、智能体工作流和 256K 上下文任务。
- 适合谁
- 适合评估低成本中国开源权重模型,用于编程 Agent、长上下文任务和 API/自部署对比的团队。
- 可信度
- 4/4 个来源已核验,且最近核验 · 2026-05-17
- 覆盖度
- 100/100
编辑结论
适合
适合评估低成本中国开源权重模型,用于编程 Agent、长上下文任务和 API/自部署对比的团队。
谨慎使用
不要把发布评测作为生产负载的唯一验收标准。
核心原因
MiMo-V2-Flash 为 MiMo 提供了一个英文文档化的开源权重锚点,包含价格、上下文、测试和部署细节。
价格
$0.1 input / $0.3 output per 1M tokens listed in the English release blog
Payment
API Platform billing, AI Studio, Hugging Face self-hosting
Commercial use
商用应遵守当前产品、API、模型许可证和计费条款。
Privacy
处理敏感负载前,请核验提示词、文件、媒体上传、保留和训练使用条款。
适用场景
编程 Agent
强发布中点名 Claude Code、Cursor、Cline 类编程工作流。
低成本 API 对比
强可用发布中的每百万 token $0.1/$0.3 价格参照,对比 DeepSeek、Qwen 和 Kimi。
开源权重自部署评估
中Hugging Face 权重和 SGLang 推理支持让它适合本地部署实验。
全球用户决策清单
注册已确认官方发布中提供 API Platform 和 AI Studio 入口。
英文界面已确认发布博客和关联访问路径面向英文用户。
API 与文档部分发布级价格和访问路径公开;平台内具体 API 参数仍需账号核验。
商用已确认发布说明 Hugging Face 权重采用 MIT 许可。
覆盖度 · 100/100
模型名称、额度、发布状态、区域接入和商用条款变化较快,采购或生产使用前请重新核验官方来源。
Pros
- - 309B 总参数、15B 激活参数
- - 256K 上下文、混合思考模式和编程 Agent 定位
- - MIT 许可权重,并在首日向 SGLang 贡献推理代码
Cons
- - 采购前应以独立测试复核发布中的性能声明
- - 托管 API 可用性可能不同于开源自部署
决策路径
deepseek-v4-api
qwen
kimi-k2-api