本文会持续更新...
Speech to Text
参考资料:https://realpython.com/python-speech-recognition/
参考资料:https://blog.csdn.net/j2IaYU7Y/article/details/79878310
- apiai (被google收购)
- google-cloud-speech
- SpeechRecognition (recognize_google需要fq,其他几种api需要key)
- wit
以上几种没有VPN访问不了
-
watson-developer-cloud
ibm的SpeechToText组件接口,亲测可用,网络不好可能不太稳定 -
baidu-aip
百度语音识别技术,文档 及 对音频文件的要求,不合要求的可以用ffmpeg转码,转码参考资料
Text to Speech
-
pyttsx3
可以调整音量、语速、音调,适用场景:有声书、语音验证码等 -
watson-developer-cloud
ibm的TextToSpeech组件接口,要吐槽的一点是目前不支持中文合成,语音定制功能还在测试阶段 -
baidu-aip
百度语音合成技术,文档
变声
-
librosa
Python module for audio and music processing