Openvino包含了一个ASR demo,展示了如何基于Kaldi神经网络的声学模型进行推理。但是该Demo只能接受Kaldi的ARK文件,所以无法覆盖端到端的语音识别(语音到文字),因此需要额外的前处理(特征提取)即从语音信号中得到特征向量,也需要后处理(解码)即从评分中产生文本。
Intel speech library
Openvino包含了一个ASR demo,展示了如何基于Kaldi神经网络的声学模型进行推理。但是该Demo只能接受Kaldi的ARK文件,所以无法覆盖端到端的语音识别(语音到文字),因此需要额外的前处理(特征提取)即从语音信号中得到特征向量,也需要后处理(解码)即从评分中产生文本。