什么叫语音模块?
语音识别技术,也被称为自动语音识别Automatic Speech Recognition,(ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。
语音识别模块概述
语音识别模块是在一种基于嵌入式的语音识别技术的模块,主要包括语音识别芯片和一些其他的附属电路,能够方便的与主控芯片进行通讯,开发者可以方便的将该模块嵌入到自己的产品中使用,实现语音交互的目的。
语音识别模块的基本原理
语音识别的基本原理如图1所示。语音识别包括两个阶段:训练和识别。不管是训练还是识别,都必须对输入语音预处理和特征提取。训练阶段所做的具体工作是收集大量的语音语料,经过预处理和特征提取后得到特征矢量参数,最后通过特征建模达到建立训练语音的参考模型库的目的。而识别阶段所做的主要工作是将输入语音的特征矢量参数和参考模型库中的参考模型 进行相似性度量比较,然后把相似性最高的输入特征矢量作为识别结果输出。 这样,最终就达到了语音识别的目的。
现有的识别技术按照识别对象可以分为特定人识别和非特定人识别。特定人识别是指识别对象为专门的人,非特定人识别是指识别对象是针对大多数用户,一般需要采集多个人的语音进行录音和训练,经过学习,达到较高的识别率。
基于现有技术开发嵌入式语音交互系统,目前主要有两种方式:一种是直接在嵌入式处理器中调用语音开发包;另一种是嵌入式处理器外围扩展语音芯片。第一种方法程序量大,计算复杂,需要占用大量的处理器资源,开发周期长;第二种方法相对简单,只需要关注语音芯片的接口部分与微处理器相连,结构简单,搭建方便,微处理器的计算负担大大降低,增强了可靠性,缩短了开发周期。
本文的语音识别模块是以嵌入式微处理器为核心,外围加非特定人语音识别芯片及相关电路构成。
语音识别模块的最小系统
一般应用中语音识别系统最小系统需要包括:控制器模块、语音识别模块、功放模块、喇叭。如果需要使用语音识别功能,系统中还需要增加麦克风。
如图2所示,用户在使用语音识别或语音唤醒功能时,上位机发送启动语音识别或语音唤醒功能的命令给语音模块,模块把从麦克风采集到的语音数据,通过内部的识别模块进行转换成相应的识别结果,通过通讯接口回传给控制器。
图2-采用Syn7318语音识别模块的系统构成图
语音识别模块的应用
随着技术的发展,传统的键盘和按钮才操作已经不能满足人们得需求了,更方便、更自然、更人性化的人机交互方式成了人们追求的方向。基于听觉的人机交互方式无疑是最具有交互友好性的方式之一。而嵌入式语音交互由于结构简单,搭建方便,已成为目前研究的热门课题。嵌入式语音识别系统和PC机的语音识别系统相比,虽然其运算速度和内存容量有一定限制,但它具有体积小、功耗低、可靠性高、投入小、安装灵活等优点,特别适用于智能家居、机器人及消费电子等领域。
恩瑞智能(中国)有限公司
Enri-Link(China)CO.,LTD