音视频基础知识

音频

数字音频：采用数字编码的方式也就是使用0和1来记录存放、编辑、压缩或播放音频的技术。

采样率：即指在一秒钟内对声音信号的采样次数，它采用赫兹(Hz)来表示，比如44.1KHz采样率的声音就是要花费44000个数据点来描述1秒钟的声音波形。原则上采样率越高，声音质量越好。

采样得到的数据写成计算机的数据格式，去除冗余信息者称之为编码，再把音频数据还原成采样值叫解码。把某一幅度范围内的电压用一个数字表示，这称之为量化。采样的值用多少位01表示即为量化精度。

码率 = 采样频率 * 量化精度 * 声道个数，也就是一秒内数据量。

1585157020575-f59a6132-7cda-4237-80b8-81acbe07c0ec.png

视频

连续的图像变化每秒超过24帧（Frame）画面以上时，根据视觉暂留原理，人眼无法辨别单幅的静态画面，看上去时平滑连续的视觉效果，这样连续的画面的叫做视频

帧是影像中常用的最小单位，相当于电影中胶片的每一个镜头，一帧就是一幅静止的画面，连续的帧就形成了视频。

帧率：每秒钟所传输图片的个数，也可以理解为处理器每秒刷新的次数，通常用FPS标识，当然帧数越高，画面也就越流畅。

转码：指将一段多媒体包括音频、视频或者其他的内容从一种编码格式转换为另外一种编码格式。(原视频 -- 解码 -- 像素数据 -- 编码 -- 目标视频)。

视频编码：就是文件当中的视频所采用的压缩算法，视频编码的主要作用是将视频像素数据(RGB, YUV等)压缩成为视频码流，从而降低视频的数据量。

其他概念入采样、采样率、码率和音频类似。

视频常用的编码格式：H.265, H.264, MPEG-4d等等，常用的就是H.264
H.264可简单的概括为帧内压缩和帧间压缩
帧内压缩即可对每个独立帧中的冗余信息去除，尽可能压缩图片尺寸
帧间压缩：多个帧组合在一起，被称为GOP，这组图片中有一张关键图片，被称为I帧，向前参考，只考虑前面已经处理的帧，被称为P帧，通过前后帧进行编码得到的帧被称为B帧。
所以 I 帧是很关键的存在，压缩 I 帧就可以很容易压制掉空间的大小，二压缩 P/B 帧可以压缩掉时间上的冗余信息。

视频的清晰度主要和分辨率和码率正相关，一般分辨率越高，清晰度越高，但超过屏幕分辨率后，视频分辨率对清晰度没什么影响了。

音视频基础知识

音频

视频

推荐阅读更多精彩内容