1 注册账号
现在要么手机号,要么微信,反正就是要手机号去开通账号啦。
开通好了就能进入控制台,如下图:
控制台
本次试用的是语音听写这个功能。
这个功能试了一下,就是说完话停顿时候会开始转文字。不能很实时的边说边转文字。
右侧的接口认证信息,后面要用,现在说下怎么快速入门。
2 编写demo
1. 进入api文档
控制台页面拉到底部,可以看到接口地址,后面有个文档,大胆点击,跳转到 语音听写(流式版)WebAPI 文档。
控制台-底部
2. 下载demo
在api文档页面,有个Demo位置,直接点击(它是本页面一个锚点,但是好像定位不太对头。建议右键-新页签打开)。
api文档
选择js语言的demo进行下载。
调用示例
3. 调试demo
这个demo的入口页面比较深,在如下图的位置:
demo目录
该demo需要在web服务下才能正常访问。所以需要起一个本地服务(比如localhost:8080),把demo拷贝到web服务的根目录下进行访问。(我这边直接下载了个phpadmin,起了apache服务,demo拷贝到WWW目录下。)
电脑需要有录音设备,然后就可以进行测试了。
注意:
demo里面index.html里面的接口参数要改成自己账号下的:
image.png
3 解读demo
index.hml页面逻辑代码是在index.js和input-file.js中。
index.js :录音按钮点击逻辑等,转文字。
input-file: 上传pcm音频,音频转文字。
crypto-js.js和同级目录下的js,都是加密相关的js,此处主要处理秘钥加密。该部分功能实际项目中一半都是后端处理。
加密若后端处理,前端这些加密js就不需要引入了。
dist目录下的js,和recoreder.js的功能类似,做录音功能。
如果你录音用的是recorder.js等其他方法,dist目录也可以替换掉。