语音信号编码

语音信号编码的主要内容

  • 1)语音信号编码的基本概念
  • 2)PCM通信系统的构成
  • 3)抽样
  • 4)量化
  • 5)编码与解码

1、语音信号编码的基本概念

    语音信号的编码指的是模拟语音信号的数字化,即信源编码。


语音编码分类.png
  • 波形编码:根据语音信号波形的特点将其转换为数字信号。常见的有PCM、DPCM、ADPCM等,其速率通常是在16kbit/s~64kbit/s的范围。
  • 参量编码:根据语音信号产生的数学模型,通过提取语音信号的一些特征参量,对其进行编码(将特征参数变换为数字代码进行传输)。LPC等声编码器属于参量编码。
  • 混合编码:介于波形编码和参量编码之间的一种编码,同时使用两种或两种以上的编码方法进行编码。子带编码属于混合编码。

2、PCM通信系统的构成

    PCM,是对模拟信号的瞬时抽样值量化、编码,以将模拟信号转化为数字信号。即PCM是模/数变换的一种方法,模/数变换的方法有很多,由此构成的数组通信系统称为PCM通信系统。


PCM数字通信系统框图.png

PCM编码的特性:

  • 抽样频率为8kHz;
  • 量化具有非均匀A率(A=87.6)13折线压扩特性;
  • 每个样值编8为码。
    则一路语音的速率为64kbit/s。其占用带宽大约为模拟单边带系统的16倍。

3、抽样

    抽样是每隔一定的时间间隔T抽取模拟信号的一个瞬时幅度值(样值)。即 模拟信号在时间上离散化得到PAM信号。

3.1、低通型信号的抽样定理

    设模拟信号的频率范围为 f0~ fM , B=fM - f0 ,当 f0 < B ,为低通型信号(语音信号等),当 f0 ≥ B,为带通型信号。则有,抽样信号频谱的频率成分为:

  • 原始频带: f0~ fM
  • 上、下边带: n fs ,其中n=1,2,....
  • 抽样频率:fs = \frac 1T ,其中T为抽样周期
一般低通型频谱.png

    接收端低通的作用是恢复或重建原模拟信号。为在接收端准确的恢复原模拟信号,避免产生折叠噪声,应满足抽样定理 fs ≥ 2 fM ,否则PAM信号产生折叠噪声,收端就无法用低通滤波器准确地恢复原模拟话音信号。但为了留有一定的防卫带,需满足 fs > 2 fM
    则对于话音信号,其频谱范围为 300~3400 Hz, fM = 3400 Hz,因需满足 fs ≥ 2 fM = 6800Hz,且为了留有一定的防卫带,需取 fs = 8000Hz,即 T= \frac 1f = 125μs,这也是 CCITT 中规定的。( 国际电信咨询机构简称CCITT,International Telephone and Telegraph Consultative Committee , 后改为ITU-T的中文名称是国际电信联盟电信标准分局(ITU-T for ITU Telecommunication Standardization Sector), 它是国际电信联盟管理下的专门制定电信标准的分支机构。)

4、量化

    量化,即将PAM信号(样值)在幅度上离散化。分为均匀量化和非均匀量化。

4.1 均匀量化

    均匀量化,即在量化区内(即从-U ~ +U, U为过载电压,话音信号的幅度主要分布在这个区间)均匀等分N(量化级数)个小间隔(Δ = \frac {2U}N)。

    若在量化区内,则取各个量化间隔的中间值;过载区内则取量化区内最大的量化值(值绝对值),即 |uq| = U - \frac Δ2 。则有
1)量化值的数目等于量化级数N,量化后对N个量化值要用二进制编码,编码的码位数为l,N=2l
2)量化误差=量化值-样值=uq(t) - u(t)
量化区内,emax(t) = \frac Δ2
过载区内,emax(t) > \frac Δ2
    量化误差会引起量化噪声,此噪声会叠加在原来的信号上,对原信号产生干扰。通常使用量化信噪比来衡量量化误差,量化噪声比越大,噪声对信号的影响也相对越小。

(S/Nq)db = 10lg \frac {S}{Nq}(dB)

其中,S为话音信号的平均功率,\frac {S}{Nq} 为量化噪声功率。

    经过上述可知均匀量化的缺点为,在N(或l) 大小适当时,均匀量化小信号的量化信噪比太小,不满足要求,而大信号的量化信噪比较大,远远满足要求。而数字通信系统中,一般要求量化信噪比要大于等于26db。则对于均匀量化,大小信号在量化区内的最大量化都是 \frac Δ2 ,量化误差等效为量化噪声功率,而小信号的信号功率小故信噪比大,大信号的信号功率大故信噪比大。为了解决这个问题,若依旧采用均匀量化,对于小信号则需要提高信噪比,因话音信号功率不变则需要降低量化噪声功率,即量化误差emax(t) 要降低,Δ = \frac {2U}N要降低,则N需要增大,又N=2l,则最终必然会引起 l 增大,这又会引起其他的问题,比如编码复杂度增大,信道利用率下降(虽然l增大,传信率会增大,但是数码率的数值近似的等于数字信号所占用的带宽,而数码率增大即需要占用的带宽增大,信道利用率自然就下降了)。

4.2 非均匀量化

    非均匀量化的宗旨在不增大量化级数 N 的前提下, 利用降低大信号的量化信噪比来提高小信号的量化信噪比。 为了达到这一目的,对于小信号(信号幅度小)需要降低量化间隔,则量化误差降低等效的噪声功率降低,进而提高量化信噪比;对于大信号(信号幅度大),量化增大量化间隔,则量化误差降低等效的噪声功率提高,进而降低量化信噪比
常用的非均匀量化方法有,模拟压扩法和直接非均匀编解码法(根据非均匀量化的划分,根据样值落在哪个间隔范围内直接对样值进行编码,相当于编码过程中就进行了量化。)

    在数字通信系统中,理论上需要抽样、量化
变化,而在实际实现中通常是根据量化间隔的划分,直接对样值进行编码,在编码过程中相当于实现了量化。

5、编码与解码

5.1、编码的基本概念及分类

    编码,是把模拟信号的样值变换成对应的二进制码组。常用的二进制码组有3种:

  • 一般二进制码
  • 循环二进制码
  • 折叠二进制码(样值的绝对值相同,其幅度码也相同)

编码主要分为:

  • 线性编码与解码,具有均匀量化特性的编码与解码,即根据均匀量化间隔的划分直接对样值编码,收端解码。
  • 非线性编码与解码,具有非均匀量化特性的编码与解码,即根据非均匀量化间隔的划分直接对样值编码,收端解码。

    PCM 通信系统一般采用非线性编码与解码,通常是根据A律13折线非均匀量化间隔的划分直接对样值编码,收端再解码。

A律13折线的码字安排.png
A律13折线的单极性量化.png

5.2、量化级数 N

    对于A律13折线编码器,分为正、负 极性,每个极性有8个量化段,每个量化段内16等分,即有N = 2x8x16 = 256, 则有
l = log2N = log2 256 = 8
对应的码字安排为

码字安排.png

    编码时先编极性码后编段落码(非线性编码)再编段内码(线性编码)。

段落码.png
段内码.png

A律13折线编码过程:


A律13折线编码过程.png

    编码过程的关键为判定值的确定。判定值是各量化段或量化级的分界点电平(IRi 或 URi),数目 nR = \frac N2-1 = 127 (l=8)。

5.3、判定值

    对于段落码,根据A律13折线的单极性量化表所示,以量化段为单位逐次对分,对分点电平依次为a2~a4的判定值。对整个量化段进行对分,对分点为128Δ,段4和段5的中间即为a2的判定值IR2,则当a2=0,说明样值<128Δ,在前4段;对前4段对分,对分点为32Δ,即IR3在段2和段3中间,此时a3=1,说明样值>32Δ, 则说明在后2段;对后2两段进行对分,对分点为64Δ,即IR4在段3和段4中间,当a4=0,说明样值<64Δ, 则说明样值在第3段。可以看出a4的判定值有4个,具体使用哪个需要通过a2、a3来决定。

段落码的判定值确定.png

    同理,对于段内码判定值的确定,是以谋量化段内量化级为单位逐次对分,对分点点平依次为 a5~a8 的判定值,其中a8的判定点用哪个需要根据a5、a6、a7的值来定。

5.4、A律13折线编码的编解码点平

(1) 编码电平与编码误差
    编码电平,即编码器输出的码字所对应的电平(IC 或者 UC )。以IC 为例:
I_{C}=I_{m}+\left ( 2^{3}\times a_{5}+2^{2}\times a_{6}+2^{1}\times a_{7}+2^{0}\times a_{8}\right )\times \Delta _{i}
编码误差为:
e_{C}=I_{C}-I_{S}
(2) 解码电平与解码误差
    解码电平,是解码器的输出电平(IC 或者 UC )。
I_{D}=I_{C}-\frac{\Delta ^{_{i}}}{2}
解码误差:
e_{D}=I_{D}-I_{S}

5.5、逐次渐进型编码器

逐次渐进型编码器.png

5.6、A律13折线解码器

A律13折线解码器.png
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,744评论 6 502
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,505评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,105评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,242评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,269评论 6 389
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,215评论 1 299
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,096评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,939评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,354评论 1 311
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,573评论 2 333
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,745评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,448评论 5 344
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,048评论 3 327
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,683评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,838评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,776评论 2 369
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,652评论 2 354

推荐阅读更多精彩内容

  • reference 《spoken language processing》 1 语音基础 名词解释 pitch ...
    艺术叔阅读 16,635评论 2 48
  • 概述 PCM 脉冲编码调制是Pulse Code Modulation的缩写。脉冲编码调制是数字通信的编码方式之一...
    充满活力的早晨阅读 32,989评论 0 19
  • PCM音频编码 ​ PCM 即脉冲编码调制 (Pulse Code Modulation)。在PCM 过程中,...
    Letcos阅读 694评论 0 0
  • 前言: 记载资料多为网络搜集,侵删。 根据最近接触的整机项目做了一些整机音频相关基础知识的总结,如有不足或表述问题...
    Gawain_Knowknow阅读 8,145评论 0 4
  • 推荐指数: 6.0 书籍主旨关键词:特权、焦点、注意力、语言联想、情景联想 观点: 1.统计学现在叫数据分析,社会...
    Jenaral阅读 5,717评论 0 5