我不是一名专业的视频剪辑师,不知道怎么让你剪出好看的片子。不过作为一名软件工程师,我很多软件基本都是拿来即用的,而很少专门花时间去学习,主要是因为我们有一种inside的能力,就是一眼就能大概知道某个功能背后的原理。
我大概就想将其中一些原理用通俗易懂的方式告诉你们,软件归根到底只是工具,希望你们不用被工具束缚想法。
下面不可避免会有一些简单的计算,这部分请大家耐心看一下,你一定会有所收获。
视频
首先,让我们来了解一下视频的本质是什么?不知道大家有没有见过手翻动画书,就是快速翻动已经画好的连续动作,然后我们看起来就像会动的一样。
我们平时看到的视频,其实原理也是跟这个是一样的,就是快速切换不同的连续画面达到的效果。
那究竟要翻的多快,我们眼睛才能感觉到画面比较流畅呢?答案是每秒20~30个画面,这也就是对应到视频上的帧率。
60fps: 60 frames per second(每秒60帧画面)
上图是手机摄像的时候可以设置的视频帧率,有些手机摄像头可以支持到60帧,这就表示这个手机1秒内可以采集60个画面的意思。帧数越高,观看效果就越细腻,对硬件的要求就越高。不知道大家还有没有印象,李安导演拍摄的《比利·林恩的中场战事》就超前使用了120帧技术,结果很多影院都无法播放,或使用低帧率的版本。
现在不少手机可以支持60帧的视频拍摄,有条件的可以用手机感受一下30帧和60帧的差别,60帧的流畅感是真香~
除了帧率这个指标,大家可能还比较关心的就是分辨率了。分辨率就是表示每一幅画面有多大,一般来说,分辨率越高,视频看起来就越清晰。我总结一下常见的分辨率:
分辨率的单位是像素(px),这里也顺便普及一下像素的概念,我把电脑屏幕抽象成下面的大格子,如果说每个小格子就是一个像素,那么每个像素有三个灯光,分别能发出红光(Red)、绿(Green)、蓝(Blue)三种颜色的光。学过初中物理我们就知道,有了这三种颜色的光,我们就能组合出来其他的颜色了。
当然啦,真实的屏幕像素不会那么大块的,就拿iphone11来说,它每英寸屏幕可以塞326个像素(326PPI)进去。
在计算机中,一般每个颜色分量有256(2的8次方)个的等级,也就是一共可以表示256(R) * 256(G) * 256(B) = 16777216中颜色。
存储一个像素,需要3个8位(bit),也就是24位,3个字节(Byte),(1Byte = 8bit,1Kb = 1024Byte,1Mb = 1024Kb,1Gb = 1024Mb)
下面我们来做个简单的数学题,计算一下1080P(分辨率1920 * 1080),帧率为30fps,时长为 1 分钟的影片,要占用多大的存储空间?
1920 * 1080 * 30 * 60 * 3 = 11197440000 (Byte) ≈ 10Gb
一分钟的视频 10 Gb?不会吧,我们平时剪出来的也就几十Mb!
这确实就是原视频大小,我们平时之所以看到的视频文件小那么多,是因为采用了压缩算法处理后的结果。
比较流行的视频压缩算法有H.264,H.265,以H.265为例,它的压缩率能够达到300~500:1。有了它,我们1080P一个小时时长的视频就能压缩到2~3G的大小了,这是非常了不起的事情!在美剧《硅谷》中,主角就是靠一个压缩算法,最终打败了硅谷最大的科技公司。
音频
上面介绍了一下视频,接着来介绍一下音频。我们知道,声音是一种波。
我们是怎么把这个声音给记录下来的呢?人们想到的办法原理很简单,就是每隔一小段时间,然后采集一次信号,只要间隔时间足够小,我们最后就能把原来的波形还原了。
不难知道,采集的间隔越小,声音的还原度就越高。那究竟这个采集的间隔要多小呢?比如我们常听MP3,它就是一秒钟采集44100或者48000次信号。我们把这个叫做采样率,表示的是每秒采集声音的数量,它用赫兹(Hz)来表示。 下面是常用的采样率:
存储一次采样的结果,就是上面波形图的那一竖,一般我们会用8~32bit的空间来存放,空间越大,能存的声音范围就越大,我们把这个叫做采样精度。
为了考考你是否是真的懂了,我们还是来做道题吧:采样率44100Hz,采样精度为16bit,通道数为2(通常我们说的立体声,可以理解每条通道就是一条声音)的1分钟声音,需要占用多少存储空间?
44100 * 16 * 2 * 60 = 8467200bit ≈ 10Mb
这么大我们肯定是不干的,于是就有了很多音频的压缩算法。我们常见的mp3、aac文件就是压缩后的音频文件。
打包格式
我们熟悉的视频文件格式有mp4、mkv等,这些格式就是把压缩好的视频和音频,按照各自的约定打包好,这样就可以非常方便我们进行存放了传输了。
总结
最后用一张图总结一下,你学废了吗?
我叫叶大侠,一名独立开发者。如果文章对你有帮助,不妨可以点赞支持一下。
文章均为原创,转载请先联系~