TTS大模型与API报价
TTS大模型效果最好的API及报价
1. ElevenLabs
- 效果:业界公认最自然、情感丰富,支持多语种和自定义声音克隆。
- API报价(2024年6月):
- 免费额度:每月1万字符
- Starter:$5/月,10万字符
- Creator:$22/月,50万字符
- Independent Publisher:$99/月,200万字符
- 超额部分约$0.30/10万字符
- 官网
2. OpenAI TTS (Speech API)
- 效果:基于Whisper和自研TTS,语音自然,适合多场景。
- API报价(2024年6月):
- $0.015/1000字符(标准)
- $0.030/1000字符(高质量)
- 官方文档
3. Microsoft Azure Speech
- 效果:多语种、情感、风格丰富,适合企业级应用。
- API报价(2024年6月):
- 标准语音:$4/100万字符
- 神经网络语音:$16/100万字符
- 官方文档
4. Google Cloud Text-to-Speech
- 效果:支持多语种、WaveNet高质量语音。
- API报价(2024年6月):
- 标准:$4/100万字符
- WaveNet:$16/100万字符
- 官方文档
5. 科大讯飞(iFLYTEK)
- 效果:中文语音合成自然度业界领先,支持多种情感、方言和自定义音色。
- API报价(2024年6月):
- 免费额度:每月10万字符
- 标准语音:约¥20/100万字符
- 智能语音合成(高质量):约¥50/100万字符
- 官方文档
- 星火大模型-开源
效果最好的开源TTS大模型
1. Bark
- 简介:Suno团队开源,支持多语种、情感、音乐、非语言声音,效果接近ElevenLabs。
- 地址:Bark GitHub
2. XTTS (Coqui)
- 简介:支持多语种、跨语言语音克隆,推理速度快,社区活跃。
- 地址:XTTS GitHub
3. VITS
- 简介:基于端到端神经网络,支持高质量语音合成,适合中文和多语种。
- 地址:VITS GitHub
4. Tortoise TTS
- 简介:以高保真和多样性著称,适合生成长文本和多风格语音。
- 地址:Tortoise TTS GitHub
5. FastSpeech2
- 简介:高效、端到端,适合实时语音合成。
- 地址:FastSpeech2 GitHub
6. 百度(Baidu PaddleSpeech)
- 简介:支持多语种、情感、风格,语音自然,适合多场景。
- 地址:
- PaddleSpeech TTS(支持多种高质量TTS模型,包括FastSpeech2、VITS等)
TTS大模型与API报价
https://summerchengh.github.io/tech-blog/2025/06/15/大模型-语音助手-TTS大模型/