CVTE在线识别搭建(效果很差)

在src/online2bin输入以下命令: ./online2-wav-nnet3-latgen-faster --do-endpointing=false --online=false --feature-type=fbank --fbank-config=../../egs/cvte/s5/conf/fbank.conf --max-active=7000 --beam=15.0 --lattice-beam=6.0 --acoustic-scale=1.0 --word-symbol-table=../../egs/cvte/s5/exp/chain/tdnn/graph/words.txt ../../egs/cvte/s5/exp/chain/tdnn/final.mdl ../../egs/cvte/s5/exp/chain/tdnn/graph/HCLG.fst 'ark:echo utter1 utter1|' 'scp:echo utter1 ../../egs/cvte/s5/data/wav/00030/2017_03_07_16.57.22_1175.wav|' ark:/dev/null

解出来的结果……呵呵呵,相当的不准,感谢kaldi群中的俊峰同学!

我认为还得自己摸索,看看它的训练,用到的特征,毕竟它用了cmvn的特征,而这个在线解码器中并没有。(这里的在线解码指的是输入wav文件,输出识别结果到控制台)

最近在摸索关键词检索,出错了,群主说可能是beam调的不对导致的lat文件出错,但我对此抱有怀疑,beam不对只会影响效果,也会影响一些硬性的输出吗?有待考证。

kaldi群里和我一批的小伙伴已经有俩放弃了,目前还有一个新认识的,新加了一堆大神,都很谦虚柔和,很好。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。