音频编码中的声学原理(上)

摘要:   为了在保证音频质量的前提下提高音频编码的压缩率,不同的音频编码器基于人的发音模型与感知模型实现了各自的编码算法。本文会介绍几种音频编码器背后的声学原理,让大家对音频编码有一个整体的认识。

1、G711(PCMA/PCMU)

1.1 非均匀量化

人类能忍受的最大声音(120dB 声压级)的幅度是最微弱声音(0dB 声压级)的100万倍,然而,耳朵不能区别差别小于1dB的声音。


表1 声压级与单位面积上功率的关系

人耳只能感受到120个不同的声压级别,其在100万幅度范围内呈对数分布。换句话说,响度与声音幅度的关系是非线性的。利用人耳的这个听觉特性,可以对声音幅度进行非均匀量化,如果采用均匀量化,每个采样需要用12bit才能达到电话语音质量,采用非均匀量化,只需要8bit。

1.2 G711

PCMA采用A定律实现非均匀量化,PCMU采用μ定律。如图1所示,两者的曲线几乎完全相同。从图中可以直观地看到,对于幅度小的信号,量化间距较小,对于幅度大的信号,量化间距较大(因为对于幅度大的信号,轻微的幅度变化人耳并不能识别)。

图1 μ定律与A定律

2、MPEG-1 音频编码

2.1 听阈

能够被听到的最低级别的声音定义为听阈,能够对人的听觉结构引起痛苦和伤害的声音级别定义为痛阈。


图2 人的听觉范围

图2的横坐标为频率范围(20-20kHz),纵坐标为声压级。从图2可以看出人的听阈随着频率的变化而变化,最敏感的频率为3000-3500Hz,最不敏感的低频端在20Hz,最不敏感的高频段在20000Hz。

2.2 掩蔽效应

掩蔽是一些声音在另一些声音存在的情况下,变得不被人们区别甚至不能被人们听见的现象。譬如在机场候机室要仔细去听公告,就是公告声音被掩蔽在了背景声音下。


图3 掩蔽信号导致听阈移位

如图3所示,被掩蔽信号(Masked Sound)频率为160Hz,声压级为39dB,在安静环境下,该信号能被感知到,因为它的声压已经超过听阈;当频率为250Hz、声压级为66dB的掩蔽信号(Masker)存在时,掩蔽信号引起听阈移位,被掩蔽信号声压级低于听阈,导致该信号无法被感知。

声音在时域也存在掩蔽效应,声音的时域掩蔽是指一个瞬时声音使其前面或后面的声音变得不能被人听见的现象。


图4 时域掩蔽的前掩蔽和后掩蔽效应

这种掩蔽造成的效应是,在掩蔽声音前面和后面的声压级都以指数下降。

2.3 MPEG-1 音频编码

MPEG-1是ISO的音频编码标准,一共有三层(Ⅰ、Ⅱ、Ⅲ),高层的编码复杂度比低层高,编码质量也更好,MPEG-1第三层就是MP3编码器。

图5 MPEG-1 层Ⅰ编码器框图

MPEG-1是一种频域编码器,信号经过一组(M=32)带通滤波器后产生32个子带信号。使用合成滤波器组可将这些子带信号合成为几乎与原始信号相同的信号。

图6 语音信号的分析和合成滤波器组系统(通道数M=4)

32个子带的带宽相等。譬如对于采样率为44.1kHz的信号,对应奈奎斯特频率为22.05kHz,每个子带的带宽为22050/32=689Hz,那么第一个子带的带宽范围为0-689Hz,第二个子带的带宽范围为689-1378Hz,依此类推。

信号经过短时傅里叶变换转到频域后,根据感知模型计算掩蔽音。如图7所示,实线为频域下的音频信号,o与x的标记代表计算得出的掩蔽音。

图7 从信号中选出遮蔽音

根据遮蔽音计算移位后的听阈,如图8所示,虚线为全局听阈。

图8 全局听阈

听阈可以指导频谱的量化。如图9所示,声压级在听阈以下的成分可以置为0而不会对声音感知造成影响。我们知道在量化时会引入一个±1/2LSB(最低有效位)以内的量化噪声,量化步长(quantization step size)越大,压缩率越高,引入的量化噪声也越大。通过保证量化噪声不超过全局听阈,就可以选择一个尽可能大的量化步长,而不会影响音质。

图9 根据阈值量化频谱,粗实线为原始频谱与量化后频谱的差值

参考文献

[1] Steven W.Smith.Digital Signal Processing[M]

[2] Lawrence R.Rabiner, Ronald W.Schafer.Theory and Applications of Digital Speech Processing[M]

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 205,033评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,725评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,473评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,846评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,848评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,691评论 1 282
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,053评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,700评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 42,856评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,676评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,787评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,430评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,034评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,990评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,218评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,174评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,526评论 2 343

推荐阅读更多精彩内容