TTS大模型与API报价

TTS大模型效果最好的API及报价

1. ElevenLabs

  • 效果:业界公认最自然、情感丰富,支持多语种和自定义声音克隆。
  • API报价(2024年6月):
    • 免费额度:每月1万字符
    • Starter:$5/月,10万字符
    • Creator:$22/月,50万字符
    • Independent Publisher:$99/月,200万字符
    • 超额部分约$0.30/10万字符
  • 官网

2. OpenAI TTS (Speech API)

  • 效果:基于Whisper和自研TTS,语音自然,适合多场景。
  • API报价(2024年6月):
    • $0.015/1000字符(标准)
    • $0.030/1000字符(高质量)
  • 官方文档

3. Microsoft Azure Speech

  • 效果:多语种、情感、风格丰富,适合企业级应用。
  • API报价(2024年6月):
    • 标准语音:$4/100万字符
    • 神经网络语音:$16/100万字符
  • 官方文档

4. Google Cloud Text-to-Speech

  • 效果:支持多语种、WaveNet高质量语音。
  • API报价(2024年6月):
    • 标准:$4/100万字符
    • WaveNet:$16/100万字符
  • 官方文档

5. 科大讯飞(iFLYTEK)

  • 效果:中文语音合成自然度业界领先,支持多种情感、方言和自定义音色。
  • API报价(2024年6月):
    • 免费额度:每月10万字符
    • 标准语音:约¥20/100万字符
    • 智能语音合成(高质量):约¥50/100万字符
  • 官方文档
  • 星火大模型-开源

效果最好的开源TTS大模型

1. Bark

  • 简介:Suno团队开源,支持多语种、情感、音乐、非语言声音,效果接近ElevenLabs。
  • 地址Bark GitHub

2. XTTS (Coqui)

  • 简介:支持多语种、跨语言语音克隆,推理速度快,社区活跃。
  • 地址XTTS GitHub

3. VITS

  • 简介:基于端到端神经网络,支持高质量语音合成,适合中文和多语种。
  • 地址VITS GitHub

4. Tortoise TTS

  • 简介:以高保真和多样性著称,适合生成长文本和多风格语音。
  • 地址Tortoise TTS GitHub

5. FastSpeech2

6. 百度(Baidu PaddleSpeech)

  • 简介:支持多语种、情感、风格,语音自然,适合多场景。
  • 地址
    • PaddleSpeech TTS(支持多种高质量TTS模型,包括FastSpeech2、VITS等)

TTS大模型与API报价
https://summerchengh.github.io/tech-blog/2025/06/15/大模型-语音助手-TTS大模型/
Author
Your Name
Posted on
June 15, 2025
Licensed under