MiniMax

MiniMax Audio / Speech

MiniMax Audio 重点跟踪 Speech 2.8、Speech 2.6 和 Speech-02 模型、40 种语言语音合成、HTTP/WebSocket 同步 TTS、异步长文本 TTS、声音克隆和官方声音管理 API。

全球可用完整英文界面公开 API免费增值可信

快速问答

一眼看懂

概览
MiniMax 国际语音能力栈,覆盖文本转语音、长文本音频、声音克隆、声音设计和声音管理。
适合谁
适合评估中国语音合成、声音克隆和多语言音频生成 API 的团队。
可信度
3/3 个来源已核验,且最近核验 · 2026-05-17
覆盖度
100/100

编辑结论

适合

适合评估中国语音合成、声音克隆和多语言音频生成 API 的团队。

谨慎使用

没有清晰授权、数据和商用审查前,不应在生产中使用克隆声音。

核心原因

MiniMax Audio 值得单独成档,因为官方 API 文档覆盖了聊天模型之外较完整的语音产品线。

价格

Audio Subscription, Token Plan quotas, Credits and pay-as-you-go billing vary by model

Payment

Audio Subscription, Token Plan, Credits, Pay-as-you-go API billing

Commercial use

声音克隆、合成声音和生成音频使用需按当前授权和产品条款核验。

Privacy

使用真人声音前,应核验上传语音样本、克隆声音保留和生成音频存储规则。

适用场景

多语言文本转语音

可用 Speech 2.8 或 2.6 评估多语言 TTS、语音聊天和在线社交场景。

长文本音频生成

异步 TTS 适合书籍或长文档等长音频任务。

声音克隆与自定义声音

声音克隆和声音设计应在法律与授权核验后使用。

全球用户决策清单

注册已确认可通过 MiniMax 国际 API 平台接入。
英文界面已确认语音文档和产品页为英文入口。
API 与文档已确认官方文档覆盖 TTS、异步 TTS、声音克隆、声音设计和声音管理。
商用需核验声音权利、授权和生成音频使用需明确审查。
覆盖度 · 100/100

生产使用前请重新核验模型列表、支持语言、Voice ID 和订阅额度。

Pros

  • - Speech 2.8 和 2.6 是当前文档列出的模型
  • - 支持 HTTP/WebSocket TTS 和异步长文本生成
  • - 提供声音克隆和声音设计 API 文档

Cons

  • - 声音权利和授权要求需要明确核验

决策路径

完整多模态接入看 API Platform

API Platform 档案覆盖计费、Key 和跨模态集成。

对比星火的中国语音工作流

星火是中国语音和垂直场景的参考。

Sources

MiniMax models overview

docs · en · verified 2026-05-17

列出 Speech 2.8、Speech 2.6 和 Speech-02 模型家族。

MiniMax speech guide

docs · en · verified 2026-05-17

记录同步 TTS 和流式调用。

MiniMax voice clone guide

docs · en · verified 2026-05-17

记录声音克隆能力。

评论