使用 watson-developer-cloud 实现 Speech to Text
几个技术点:
- 申请 IBM Cloud 账号,控制器可查看 api key
service = SpeechToTextV1(
## url is optional, and defaults to the URL below. Use the correct URL for your region.
url='https://stream.watsonplatform.net/speech-to-text/api',
iam_apikey='your key')
- 参数解释
- model :识别请求的模型标识,见 Languages and models
- 宽带模型用于采样率大于或等于 16 千赫兹的音频。请将宽带模型用于响应式实时应用,例如用于实时语音应用。
- 窄带模型用于采样率为 8 千赫兹的音频。请将窄带模型用于电话语音的脱机解码,这是此采样率的典型用途。
- content_type :音频格式,可忽略或标识全能头,application/octet-stream
- inactivity_timeout :不活动状态超时时间,单位秒
- 返回结果是dict