音视频系列---1.1声音

声音

1.1声波的三要素

声波的三要素是频率、振幅和波形,频率代表音阶的高低,振幅代
表响度,波形代表音色。

频率

频率(过零率)越高,波长就越短。低频声响的波长则较长,所以 其可以更容易地绕过障碍物,因此能量衰减就小,声音就会传得远,反 之则会得到完全相反的结论。

响度

响度其实就是能量大小的反映,用不同的力度敲击桌子,声音的大 小势必也会不同。在生活中,分贝常用于描述响度的大小。声音超过一 定的分贝,人类的耳朵就会受不了。

音色

音色其实也不难理解,在同样的音调(频率)和响度(振幅)下, 钢琴和小提琴的声音听起来是完全不相同的,因为它们的音色不同。波 的形状决定了其所代表声音的音色,钢琴和小提琴的音色不同就是因为 它们的介质所产生的波形不同。

1.2 数字音频

44.1kHz

音频信号,其频率范围(人耳 能够听到的频率范围)是20Hz~20kHz,所以采样频率一般为 44.1kHz,这样就可以保证采样声音达到20kHz也能被数字化

16比特

具体的每个采样又该如何表示呢?这就涉及将要讲解的第二 个概念:量化。量化是指在幅度轴上对信号进行数字化,比如用16比特 的二进制信号来表示声音的一个采样,而16比特(一个short)所表示的 范围是[-32768,32767],共有65536个可能取值,因此最终模拟的音频 信号在幅度上也分为了65536层(如图1-6所示)。

量化

很多种格式,通常所说的音频的裸数据格式就是脉冲 编码调制(Pulse Code Modulation,PCM)数据。描述一段PCM数据一 般需要以下几个概念:量化格式(sampleFormat)、采样率 (sampleRate)、声道数(channel)。以CD的音质为例:量化格式(有 的地方描述为位深度)为16比特(2字节),采样率为44100,声道数为 2,这些信息就描述了CD的音质。而对于声音格式,还有一个概念用来 描述它的大小,称为数据比特率,即1秒时间内的比特数目,它用于衡 量音频数据单位时间内的容量大小。而对于CD音质的数据,比特率为 多少呢?计算如下:
44100 * 16 * 2 = 1378.125kbps

总结:

人类耳朵的听力有一个频率范围,大约是20Hz~20kHz,
根据采样定理,采样频率大于等于工作频率的二倍,才能恢复出实际波形。以正弦波为例,要完整恢复,bai必须正负半周都采样到,不然是恢复出的波形就变样了,所以要求采样频率大于等于二倍带宽
16比特 只是个定义,

1.3 音频编码

PCM、WAV、AAC、MP3、 Ogg等。

WAV编码

PCM(脉冲编码调制)是Pulse Code Modulation的缩写。前面已经 介绍过PCM大致的工作流程,而WAV编码的一种实现(有多种实现方 式,但是都不会进行压缩操作就是在<font color="red">PCM数据格式的前面加上44字 节</font>,分别用来描述PCM的采样率、声道数、数据格式等信息。
特点:音质非常好,大量软件都支持。 适用场合:多媒体开发的中间文件、保存音乐和音效素材。

MP3编码

MP3具有不错的压缩比,使用LAME编码(MP3编码格式的一种实 现)的中高码率的MP3文件,听感上非常接近源WAV文件,当然在不 同的应用场景下,应该调整合适的参数以达到最好的效果。
特点:音质在128Kbit/s以上表现还不错,压缩比比较高,大量软件 和硬件都支持,兼容性好。
适用场合:高比特率下对兼容性有要求的音乐欣赏。

AAC编码

AAC是新一代的音频有损压缩技术,它通过一些附加的编码技术 (比如PS、SBR等),衍生出了LC-AAC、HE-AAC、HE-AAC v2三种 主要的编码格式。LC-AAC是比较传统的AAC,相对而言,其主要应用 于中高码率场景的编码(≥80Kbit/s);HE-AAC(相当于AAC+SBR) 主要应用于中低码率场景的编码(≤80Kbit/s);而新近推出的HE-AAC v2(相当于AAC+SBR+PS)主要应用于低码率场景的编码 (≤48Kbit/s)。事实上大部分编码器都设置为≤48Kbit/s自动启用PS技 术,而>48Kbit/s则不加PS,相当于普通的HE-AAC。
特点:在小于128Kbit/s的码率下表现优异,并且多用于视频中的音频编码。
适用场合:128Kbit/s以下的音频编码,多用于视频中音频轨的编码。

Ogg编码

Ogg是一种非常有潜力的编码,在各种码率下都有比较优秀的表 现,尤其是在中低码率场景下。Ogg除了音质好之外,还是完全免费的,这为Ogg获得更多的支持打好了基础。Ogg有着非常出色的算法, 可以用更小的码率达到更好的音质,128Kbit/s的Ogg比192Kbit/s甚至更 高码率的MP3还要出色。但目前因为还没有媒体服务软件的支持,因此 基于Ogg的数字广播还无法实现。Ogg目前受支持的情况还不够好,无论是软件上的还是硬件上的支持,都无法和MP3相提并论。
特点:可以用比MP3更小的码率实现比MP3更好的音质,高中低码 率下均有良好的表现,兼容性不够好,流媒体特性不支持。
适用场合:语音聊天的音频消息场景。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,294评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,780评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,001评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,593评论 1 289
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,687评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,679评论 1 294
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,667评论 3 415
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,426评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,872评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,180评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,346评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,019评论 5 340
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,658评论 3 323
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,268评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,495评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,275评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,207评论 2 352

推荐阅读更多精彩内容