Qwen

探索 Qwen TTS 的模型

直接进入你想比较、测试或用于生成的具体模型页面。

汇总该提供方主要模型系列中的共性优势。

Text To SpeechPreset VoicesSpeaker Style CloningVoice ControlsAdjustable DecodingMultilingual Output

你可以直接使用预设音色快速生成，也可以通过声纹风格工作流获得更一致的角色声音输出。

可通过解码参数调节表达强度、稳定性与读音表现，在自然度与可控性之间取得平衡。

适合旁白、有声内容、语音助手和对话类产品等需要稳定迭代与批量生产的文本转语音场景。

当你需要更可控的文本转语音，并希望在预设音色和声纹风格之间灵活切换时，优先使用 Qwen 3 TTS 1.7B。

填写文本后，选择预设音色或配置声纹风格，同时设置合适的解码参数。

根据试听结果微调文案与参数，优化节奏、发音与语气风格。

在这里集中浏览 Qwen TTS 的全部音频模型，适用于文本转语音与语音生成工作流。

1 个模型

Text-to-speech with preset voices or cloned speaker embeddings and controllable decoding parameters.

关于 Qwen TTS 模型和工作流的常见问题。

什么是 Qwen TTS？expand_more

Qwen TTS 是通义系的文本转语音模型系列，可将文本生成自然语音，并支持可调语音参数。

Qwen TTS 支持声纹风格工作流吗？expand_more

支持。除了预设音色外，Qwen TTS 也可用于声纹风格工作流，以提升角色声音一致性。

如何提升 Qwen TTS 输出质量？expand_more

可以从文案结构、停顿表达与解码参数三方面迭代，通常能显著提升可懂度和自然度。

Qwen TTS 适合哪些业务场景？expand_more

常见于视频旁白、内容有声化、对话交互、语音助手与批量语音生产流程。