Alibaba Cloud

Qwen Audio / CosyVoice

Qwen Cloud 列出 CosyVoice-v3-plus 高质量语音合成和声音克隆、Qwen3-ASR-Flash-Realtime 多语言实时语音识别,文档还列出 Qwen3.5-Omni-Flash-Realtime 实时多模态语音对话。

全球可用完整英文界面公开 API免费增值可信

快速问答

一眼看懂

概览
Qwen Cloud 的语音栈,覆盖文本转语音、声音克隆、语音识别和实时多模态语音。
适合谁
适合通过英文平台评估中国语音合成、声音克隆、ASR 和实时语音 API 的团队。
可信度
2/2 个来源已核验,且最近核验 · 2026-05-17
覆盖度
100/100

编辑结论

适合

适合通过英文平台评估中国语音合成、声音克隆、ASR 和实时语音 API 的团队。

谨慎使用

未明确授权和核验保留规则前,不应生产使用克隆声音。

核心原因

Qwen Cloud 已有足够官方音频证据,值得单独放入音频分类。

价格

Free tier and pay-as-you-go speech API billing vary by model

Payment

Qwen Cloud billing, Token Plan where supported, Pay-as-you-go API billing

Commercial use

商用应遵守当前产品、API、模型许可证和计费条款。

Privacy

处理敏感负载前,请核验提示词、文件、媒体上传、保留和训练使用条款。

适用场景

文本转语音与声音克隆

使用 CosyVoice 评估专业语音合成和自定义声音生成。

实时多语言 ASR

使用 Qwen3-ASR-Flash-Realtime 进行多语言语音识别测试。

全球用户决策清单

注册已确认Qwen Cloud 英文模型市场和文档列出音频条目。
英文界面已确认模型市场和文档面向英文用户。
API 与文档已确认文档包含 TTS、ASR 和语音到语音模型分类。
商用需核验声音克隆、合成语音和录音需要授权与政策审查。
覆盖度 · 100/100

模型名称、额度、发布状态、区域接入和商用条款变化较快,采购或生产使用前请重新核验官方来源。

Pros

  • - TTS、声音克隆、ASR 和实时语音分类均有文档
  • - 英文模型市场可见 CosyVoice 和 Qwen3-ASR

Cons

  • - 声音克隆需要授权和数据处理审查

决策路径

minimax-audio

zhipu-glm-audio

sparkdesk

Sources

Qwen Cloud model marketplace

official · en · verified 2026-05-17

列出 CosyVoice-v3-plus 和 Qwen3-ASR-Flash-Realtime。

Qwen Cloud model selection

docs · en · verified 2026-05-17

列出文本转语音、语音转文本和语音到语音分类。

评论