Alibaba Cloud
Qwen Audio / CosyVoice
Qwen Cloud 列出 CosyVoice-v3-plus 高质量语音合成和声音克隆、Qwen3-ASR-Flash-Realtime 多语言实时语音识别,文档还列出 Qwen3.5-Omni-Flash-Realtime 实时多模态语音对话。
全球可用完整英文界面公开 API免费增值可信
快速问答
一眼看懂
- 概览
- Qwen Cloud 的语音栈,覆盖文本转语音、声音克隆、语音识别和实时多模态语音。
- 适合谁
- 适合通过英文平台评估中国语音合成、声音克隆、ASR 和实时语音 API 的团队。
- 可信度
- 2/2 个来源已核验,且最近核验 · 2026-05-17
- 覆盖度
- 100/100
编辑结论
适合
适合通过英文平台评估中国语音合成、声音克隆、ASR 和实时语音 API 的团队。
谨慎使用
未明确授权和核验保留规则前,不应生产使用克隆声音。
核心原因
Qwen Cloud 已有足够官方音频证据,值得单独放入音频分类。
价格
Free tier and pay-as-you-go speech API billing vary by model
Payment
Qwen Cloud billing, Token Plan where supported, Pay-as-you-go API billing
Commercial use
商用应遵守当前产品、API、模型许可证和计费条款。
Privacy
处理敏感负载前,请核验提示词、文件、媒体上传、保留和训练使用条款。
适用场景
文本转语音与声音克隆
强使用 CosyVoice 评估专业语音合成和自定义声音生成。
实时多语言 ASR
强使用 Qwen3-ASR-Flash-Realtime 进行多语言语音识别测试。
全球用户决策清单
注册已确认Qwen Cloud 英文模型市场和文档列出音频条目。
英文界面已确认模型市场和文档面向英文用户。
API 与文档已确认文档包含 TTS、ASR 和语音到语音模型分类。
商用需核验声音克隆、合成语音和录音需要授权与政策审查。
覆盖度 · 100/100
模型名称、额度、发布状态、区域接入和商用条款变化较快,采购或生产使用前请重新核验官方来源。
Pros
- - TTS、声音克隆、ASR 和实时语音分类均有文档
- - 英文模型市场可见 CosyVoice 和 Qwen3-ASR
Cons
- - 声音克隆需要授权和数据处理审查
决策路径
minimax-audio
zhipu-glm-audio
sparkdesk
Sources
Qwen Cloud model marketplace
official · en · verified 2026-05-17
列出 CosyVoice-v3-plus 和 Qwen3-ASR-Flash-Realtime。