为了更直观的理解语音识别的输入和输出,做了timit在线识别的实验,根据@bbzz2博主的分享http://m.blog.csdn.net/lijin6249/article/details/51838936,对timit数据集进行了实验,步骤相同,其中要感谢kaldi群中魏同学无私的帮助。
首先要安装portaudio;
$cd ~/kaldi-trunk/tools/
$./install_portaudio.sh
然后编译onlinebin
$cd ~/kaldi-trunk/src/onlinebin/
$make
运行./run.sh脚本发现出现3个错误:
1:找不到audio/trans.txt:没有那个文件或目录
解决办法,在audio文件夹下创建一个空的trans.txt touch trans.txt
2.
WaveData: expected RIFF or RIFX, got NIST
这个错误是wav格式问题
kaldi/tools/sph2pipe_v2.5$ vim 0readme.1st
在这个目录下打开0readme.1st
里面有编译步骤
如果你已经有
有sph2pipe这个文件,就不用编译了,就是绿色这个
./sph2pipe -f rif test_audio.wav test_out.wav
test_audio.wav这个文件就是你的测试文件
要指定目录