语音识别之Speech2Text(二)

使用 watson-developer-cloud 实现 Speech to Text

几个技术点:

  • 申请 IBM Cloud 账号,控制器可查看 api key
service = SpeechToTextV1(
    ## url is optional, and defaults to the URL below. Use the correct URL for your region.
    url='https://stream.watsonplatform.net/speech-to-text/api',
    iam_apikey='your key')
  • 宽带模型用于采样率大于或等于 16 千赫兹的音频。请将宽带模型用于响应式实时应用,例如用于实时语音应用。
  • 窄带模型用于采样率为 8 千赫兹的音频。请将窄带模型用于电话语音的脱机解码,这是此采样率的典型用途。
  1. content_type :音频格式,可忽略或标识全能头,application/octet-stream
  2. inactivity_timeout :不活动状态超时时间,单位秒
  3. 返回结果是dict
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

友情链接更多精彩内容