在 GitHub 上,有许多开源的 文字转音频(Text-to-Speech, TTS) 项目,以下是一些 受欢迎、高质量、持续更新 的 TTS 开源软件排行(按 Star 数和影响力排序):
🔥 顶级开源 TTS 项目
1. Coqui TTS (⭐ 14k+)
- 特点:基于深度学习的多语言 TTS,支持 Tacotron2、FastSpeech、VITS 等模型,可训练自定义语音。
- 语言:Python
- 亮点:支持多种声学模型和声码器,适合研究和生产环境。
2. VITS (⭐ 5k+)
- 特点:端到端 TTS 模型,结合变分推理和对抗训练,生成高质量语音。
- 语言:Python (PyTorch)
- 亮点:支持多语言,音质优秀。
3. Edge TTS (⭐ 3k+)
- 特点:调用微软 Edge 浏览器的 TTS API,免费且支持多种语言和声音。
- 语言:Python
- 亮点:简单易用,适合快速部署。
4. espeak-ng (⭐ 2k+)
- 特点:轻量级命令行 TTS 引擎,支持多种语言,适合嵌入式系统。
- 语言:C
- 亮点:Linux 默认 TTS 工具之一,支持音调调整。
5. Mimic 3 (⭐ 1k+)
特点:Mycroft AI 开源的本地 TTS 引擎,支持自定义语音训练。
语言:Python
亮点:隐私友好,可离线运行。
6. Festival & Flite
特点:经典 TTS 系统(Festival 是完整版,Flite 是轻量版)。
语言:C++
亮点:学术研究常用,支持多语言。
🌍 多语言/离线 TTS
- MaryTTS (Java, 支持德语、英语等)
- Piper (⭐ 3k+, 轻量级神经网络 TTS)
- TensorFlowTTS (⭐ 2k+, TensorFlow 2 实现的 TTS)
🎤 中文 TTS 专项
- PaddleSpeech (⭐ 7k+, 百度开源,支持中文 TTS & ASR)
- EasyTTS (⭐ 500+, 简单易用的中文 TTS)
📱 移动端/嵌入式 TTS
- RhVoice (Android/Linux 开源语音合成)
- Silero TTS (⭐ 4k+, 俄语/英语 TTS,适合移动端)
🔍 如何选择?
- 想要高质量语音 → VITS / Coqui TTS
- 需要离线 & 轻量级 → espeak-ng / Piper
- 中文支持 → PaddleSpeech / EasyTTS
- 快速调用在线 API → Edge TTS