make_mfcc_pitch.sh阅读笔记

make_mfcc_pitch.sh阅读笔记
计算mfcc和pitch特征
调用方式: steps/make_mfcc_pitch.sh --cmd "train_cmd" --nj 10 data/x exp/make_mfcc/xmfccdir || exit 1;

提取特征代码:
compute-mfcc-feats #提取mfcc特征
compute-kaldi-pitch-feats #提取pitch特征

特征处理代码:
paste-feats
copy-feats

用法示例:
kaldi-trunk/src/featbin/compute-mfcc-feats --use-energy=false --verbose=2 --config=../conf/mfcc.conf scp:lable_to_wav.scp ark:myfeats.ark

其中,lable_to_wav.scp:

BAC009S0002W0122 kaldi-trunk/egs/aishell/aishell-data/data_aishell/wav/train/S0002/BAC009S0002W0122.wav

提取的特征存入myfeats.ark中.

如何查看myfeats.ark?
kaldi-trunk/src/featbin/copy-feats ark:myfeats.ark ark,t:- | head

BAC009S0002W0122 [
37.94254 -14.98815 3.779812 -2.988866 6.984592 12.55763 21.91789 14.40024 0.8388216 0.7873834 18.17512 21.27639 7.671076
36.66135 -16.34631 7.26571 3.157262 7.532941 5.298943 6.635718 3.382703 -4.179379 3.944365 6.671023 5.486343 7.753448

此时提取的是MFCC特征,每帧特征长度为13维。
对特征生成scp文件:
kaldi-trunk/src/featbin/copy-feats ark:myfeats.ark ark,scp:tttt.ark,tttt.scp

输出tttt.scp:
BAC009S0002W0122 tttt.ark:17
表示BAC009S0002W0122这条音频的特征矩阵首地址存在myfeats.ark中第17个字节(不确定是否是字节,大概这个意思)开始的位置。

注:
ark:- | #标准输出
scp,p: #后跟输入文件

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 张国荣坠楼殒身 梅艳芳患病离世 曾经许下的诺言 终是花飞叶落随风眠 什么心有灵犀 什么两情相悦 多少人败给了等待 ...
    艾弥儿阅读 522评论 0 20
  • 在红楼梦里,贾府要建造省亲别墅,各项工程都需要人手。其中贾蔷新任担当着聘请教习,采买女孩子,置办乐器行头的活儿。总...
    龙少之说阅读 224评论 0 0
  • (一) 独自起舞的日子 小学的时候,我还是个比较乖巧的小孩。 不知为什么,到了中学就变了。 那是个开学不久的下午,...
    玫瑰上海阅读 319评论 0 1
  • 20170511+钟月娸+阅读时光Day1 《断舍离》40min 1,要想幸福,我们需要先放下对幸福的执念。具体有...
    钟有米阅读 215评论 0 1
  • 今天去看医生回来的路上,觉得自己好可怜。在异乡,生着病,淋着雨,独自走在雨里去医院,只撑了一把酒店大堂借来...
    我爱张桂花阅读 282评论 0 0