语音识别技术,也被称为自动语音识别 (Automatic Speech Recognition, ASR),它是一门交叉学科,与人们的生活和学习密切相关。其目标是将说话者的词汇内容转换为计算机可读的输入按键、二进制编码或宇符序列等。例如,打银行的客服电话,可以直接和银行系统对话,而不是普通的 “请按 1〞 等把人当成机器的询问。在通信中,可以把对方的语音留言转换成文字,还可以根据识别出的文字识别语义,这样可以让机器和人交流。再如,儿童识别图片后,可以说出这个图中是老虎还是大象,系统使用语音识別技术判断孩子回答是否正确,对于不正确的,系统自动给出提示。
做好开放式语音识别不容易,可以辅助人工输入字幕,类似于语音输入法。