输入维度【5,522,40】——添加维度【5,1,522,40】——
第一次卷积【5,64,260,20】——第二次卷积【5,128,129,10】——
维度交换128和129维度交换,然后128和10维度相衬【5,129,1280】——
全连接层【5,129,256】
最后输出的数据特征和掩码
#1.输入语音数据维度
【5,522,40】
5是指语音条数,522是输入的语音最大的维度,40是提取的特征维度
【522,40】输入的掩码
#2.卷积
【5,1,522,40】
卷积之前要添加一个维度
#2.1第一次卷积
【5,1,522,40】
用64个3*3的卷积核进行卷积乘法运算之后的维度64维度变化发生在第二个维度
【5,64,260,20】
#2.2第二次卷积
用128个卷积核进行卷积的运算