音频
数字音频:采用数字编码的方式也就是使用0和1来记录存放、编辑、压缩或播放音频的技术。
采样率:即指在一秒钟内对声音信号的采样次数,它采用赫兹(Hz)来表示,比如44.1KHz采样率的声音就是要花费44000个数据点来描述1秒钟的声音波形。原则上采样率越高,声音质量越好。
采样得到的数据写成计算机的数据格式,去除冗余信息者称之为编码,再把音频数据还原成采样值叫解码。把某一幅度范围内的电压用一个数字表示,这称之为量化。采样的值用多少位01表示即为量化精度。
码率 = 采样频率 * 量化精度 * 声道个数,也就是一秒内数据量。
视频
连续的图像变化每秒超过24帧(Frame)画面以上时,根据视觉暂留原理,人眼无法辨别单幅的静态画面,看上去时平滑连续的视觉效果,这样连续的画面的叫做视频
帧是影像中常用的最小单位,相当于电影中胶片的每一个镜头,一帧就是一幅静止的画面,连续的帧就形成了视频。
帧率:每秒钟所传输图片的个数,也可以理解为处理器每秒刷新的次数,通常用FPS标识,当然帧数越高,画面也就越流畅。
转码:指将一段多媒体包括音频、视频或者其他的内容从一种编码格式转换为另外一种编码格式。(原视频 -- 解码 -- 像素数据 -- 编码 -- 目标视频)。
视频编码:就是文件当中的视频所采用的压缩算法,视频编码的主要作用是将视频像素数据(RGB, YUV等)压缩成为视频码流,从而降低视频的数据量。
其他概念入采样、采样率、码率和音频类似。
视频常用的编码格式:H.265, H.264, MPEG-4d等等,常用的就是H.264
H.264可简单的概括为帧内压缩和帧间压缩
帧内压缩即可对每个独立帧中的冗余信息去除,尽可能压缩图片尺寸
帧间压缩:多个帧组合在一起,被称为GOP,这组图片中有一张关键图片,被称为I帧,向前参考,只考虑前面已经处理的帧,被称为P帧,通过前后帧进行编码得到的帧被称为B帧。
所以 I 帧是很关键的存在,压缩 I 帧就可以很容易压制掉空间的大小,二压缩 P/B 帧可以压缩掉时间上的冗余信息。
视频的清晰度主要和分辨率和码率正相关,一般分辨率越高,清晰度越高,但超过屏幕分辨率后,视频分辨率对清晰度没什么影响了。