MiniMax
MiniMax Audio / Speech
MiniMax Audio 重点跟踪 Speech 2.8、Speech 2.6 和 Speech-02 模型、40 种语言语音合成、HTTP/WebSocket 同步 TTS、异步长文本 TTS、声音克隆和官方声音管理 API。
全球可用完整英文界面公开 API免费增值可信
快速问答
一眼看懂
- 概览
- MiniMax 国际语音能力栈,覆盖文本转语音、长文本音频、声音克隆、声音设计和声音管理。
- 适合谁
- 适合评估中国语音合成、声音克隆和多语言音频生成 API 的团队。
- 可信度
- 3/3 个来源已核验,且最近核验 · 2026-05-17
- 覆盖度
- 100/100
编辑结论
适合
适合评估中国语音合成、声音克隆和多语言音频生成 API 的团队。
谨慎使用
没有清晰授权、数据和商用审查前,不应在生产中使用克隆声音。
核心原因
MiniMax Audio 值得单独成档,因为官方 API 文档覆盖了聊天模型之外较完整的语音产品线。
价格
Audio Subscription, Token Plan quotas, Credits and pay-as-you-go billing vary by model
Payment
Audio Subscription, Token Plan, Credits, Pay-as-you-go API billing
Commercial use
声音克隆、合成声音和生成音频使用需按当前授权和产品条款核验。
Privacy
使用真人声音前,应核验上传语音样本、克隆声音保留和生成音频存储规则。
适用场景
多语言文本转语音
强可用 Speech 2.8 或 2.6 评估多语言 TTS、语音聊天和在线社交场景。
长文本音频生成
强异步 TTS 适合书籍或长文档等长音频任务。
声音克隆与自定义声音
中声音克隆和声音设计应在法律与授权核验后使用。
全球用户决策清单
注册已确认可通过 MiniMax 国际 API 平台接入。
英文界面已确认语音文档和产品页为英文入口。
API 与文档已确认官方文档覆盖 TTS、异步 TTS、声音克隆、声音设计和声音管理。
商用需核验声音权利、授权和生成音频使用需明确审查。
覆盖度 · 100/100
生产使用前请重新核验模型列表、支持语言、Voice ID 和订阅额度。
Pros
- - Speech 2.8 和 2.6 是当前文档列出的模型
- - 支持 HTTP/WebSocket TTS 和异步长文本生成
- - 提供声音克隆和声音设计 API 文档
Cons
- - 声音权利和授权要求需要明确核验
决策路径
完整多模态接入看 API Platform
API Platform 档案覆盖计费、Key 和跨模态集成。
对比星火的中国语音工作流
星火是中国语音和垂直场景的参考。