登录注册写文章

Kaldi Chain model 文件解析

期望最大化

Kaldi Chain model 文件解析

nnet3-info 可以查看训练好的chain model 模型结构，如下：

final.mdl.head

注意点

两个output，是因为有两个目标函数，一个是基于线性的，一个是基于CE的，实际结果是两个结果的加权值。训练中反向传播的时候也是用的加权值。作用是预防训练训偏掉了。 multitask learning？
输入是40维fbank，lda层操作：首先做了一个扩帧到200维，然后做了lda，这里的lda并没有降维，只是起到了解相关的操作。输出仍然是200维。
参数计算：
tdnn1 2001024 + 1024
tdnn2 20481024 + 1024
tdnn3 20481024 + 1024
tdnn4 20481024 + 1024
tdnn5 20481024 + 1024
output.affine component （10241024 + 1024）+ （10246508 + 6508）
output-xent.affine component （10241024 + 1024）+ （1024*6508 + 6508）
所有参数加起来正好等于最前面的24039128

Reference

http://kaldi-asr.org/doc/index.html
https://www.danielpovey.com/files/2015_interspeech_multisplice.pdf

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

机器学习英语词汇--5
activation 激活值 activation function 激活函数 additive noise 加性...
630d0109dd74阅读 4,763评论 0赞 1
chain model 翻译
翻译http://kaldi-asr.org/doc/chain.html 时间2018年12月13日基于前人翻译...
sky_186阅读 7,063评论 0赞 2

【图像检索】【TPAMI重磅综述】 SIFT与CNN的碰撞：万字长文回顾图像检索任务十年探索历程
由于简书对latex公式支持不太友好，因此为了更好的阅读体验，你可以移步至：【TPAMI重磅综述】 SIFT与C...
keloli阅读 11,330评论 0赞 18
只是刚好情窦初开遇到你——2018.12.10
今晚听张紫豪版本的《可不可以》，细细聆听，竟有如此贴合我心境的歌词。“可不可以，和你在一起，我们之间有太多回忆，爱...
大猪汤阅读 3,926评论 2赞 0
寒山问拾得
昔日寒山问拾得：世间有人谤我、欺我、辱我、笑我、轻我、贱我、骗我，如何处置乎？拾得回答说：忍他、让他、避他、由他、...
Miss_Raquel阅读 5,400评论 2赞 1

1赞2赞

赞赏

手机看全文