音频相关的基础知识

声音是什么

声音(sound)是由物体振动产生的声波。声音作为一种波,频率在20 Hz~20 kHz之间的声音是可以被人耳识别的。-----百度百科夫斯基
敲黑板:波、人耳识别频率:20 Hz~20 kHz

音频录制

最简单的音频录制流程为:

设备采集获取模拟信号 ---》模数转换 ---》存储(播放、传输等)


录音最简流程

播放端流程相反:
音频文件 ---》数模转换 ---》播放器播放

模数转换

模拟信号转化为数字信号的流程(心疼大学老师一秒钟):

pcm脉冲调制图

如上图:
采样: 对模拟信号隔一定的时间间隔取一个点(图中交点)
量化: 给纵坐标加刻度,根据近似取整数值,使采样的到的点的值都是整数。
编码: 对量化取得的整数值按二进制进行编码
数字信号: 把编码的到的 0 和 1 的序列变现为高低电平的信号

上述整个模数转换的过程称为:脉冲编码调制(PulseCodeModulation),简称PCM

PCM 格式

由上面的模数转换可知,PCM 格式文件存储的内容实际上就是编码的到的序列。

采样率:

每秒的采样次数。
对于声音来说,从上图采样的过程可以看的出来,采样率越高,即每秒内的采样点越多,采样点越密集,也就意味着离散信号对模拟信号的还原度越高。

合适的采样率

采样点无限多即连成原来的模拟信号曲线。当然,无限多的点无线多的数据存储和 cpu 也不允许啊。那什么样的采样率比较合适呢?
活着不一定是为了死去,但录制最终一定是为了播放。采样编码为了存储处理和传输,最终还是要还原出模拟信号来播放。
根据 “奈奎斯特采样理论”:
当对被采样的模拟信号进行还原时,其最高频率只有采样频率的一半。(装逼一定要用又黑又粗。。。。的文字)
换句话说:
要想重构完整的模拟信号,采样率要是模拟信号频率的两倍以上。--- gray_dog3
鉴于前面敲黑板所讲,人听觉范围:20 Hz -20 KHz
所以对于给人听的音频,采样率要宁杀错不放过,要大于40 KHz 才不会使人感觉到音质受损。
由此的出,合适的采样率 一般大于 40 KHz,注意是一般,你要是小一些高音会受损,不过除了对那些能听出热情火电和清冽水电的耳机党外,略小应该也不明显,平常 8k,16k 都有。

来自严谨党的质问:为什么大多数音频采样率采用 44.1K?不是 40K,也不是 44K,非要带个 0.1。
答:靠,你哪那么多为什么。
装逼专用: 在高深莫测的数学领域有一个神奇的数字即44100,前四个素数的平方的乘积44100:2x2x3x3x5x5x7x7=44100
靠谱回答:历史原因,早期录像机:245扫描线,一行 3 个数据块,60场频:245x3x60=44100,现在也有在推 48kHz,甚至 96kHz 的。

采样深度:

即量化时纵坐标的量化粒度。
在模拟信号中,纵坐标代表的是声音的响度,即音量。
由上图量化过程可知,当量化的粒度越细,离散点取的值也就越接近模拟信号实际的值,如果量化时,采样深度为 1bit,即量化只能为 1 和 0,那每首歌听起来都像忐忑,一惊一乍的,要么播放最大声音,要么没有声音。只有采样深度越深,即量化的粒度越细,采样出来的数据,才更接近实际的音量。
现在一般用 16 位来表示一个采样数据的音量大小。
敲黑板:16 位采样深度,即一个采集的样本点中,音量大小用16 位二进制数来表示音量大小。

声道和立体声

友情提示:声音,音频,但是声道就只能读作声道,不能读作音道
单声道 Monaural:只有一个采集器采集音频做以上图中的流程处理。
立体音 Stereophonic:两个或两个以上声道数,多个设备录音,然后数据编码整合到一起。常见的有 双声道,4.1 环绕立体声(四个音源加一个低音喇叭来加强低音)5.1 、7.1 环绕立体声(杜比音效:装逼知识点)

PCM 数据

有了已上的认识,妈妈再也不用担心我看不懂 pcm 格式了。不废话,直接上图:


pcm 数据格式图

你没有看错,就是这么简单。对于 8 位采样深度的单声道,8 位表示一个采样的音量,都是这样的采样数据。pcm 就是原始数据,没有header,全是 body,满满的干货。
双声道就是两个声道数据交替排列。

播放 PCM

由上面格式也可以看出 pcm 没有 header,没有采样率等信息,所以播放时需要告诉播放器:采样率、采样深度、声道数。
只有有了这些信息,播放器才知道读入 pcm 文件流的速度,以及读入数据该如何进行数模转换。
通常播放 pcm 用的 是 VLC 播放器,我在 mac 上使用的,windows 的百度下,播放应该很简单。就是这货:



/Applications/VLC.app/Contents/MacOS/VLC --demux=rawaud --rawaud-channels 1 --rawaud-samplerate 44100 record.pcm

上面samplerate 采样率,channels声道数,现在都默认 16 位的,具体有 8 位的需求可以百度下。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,417评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,921评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,850评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,945评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,069评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,188评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,239评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,994评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,409评论 1 304
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,735评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,898评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,578评论 4 336
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,205评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,916评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,156评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,722评论 2 363
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,781评论 2 351

推荐阅读更多精彩内容