随着短视频app的发展,手机端对视频解码性能越来越高,如果采用cpu进行解码,则会占用很多cpu资源.现在主流做法是利用手机gpu资源进行视频解码。Android系统在Android4.0(API 16)增加了MediaCodec,可以支持app调用java接口,进而使用底层硬件的音视频编解码能力。Android ndk在 Android5.0(API21) 提供了对应的Native方法。功能大体相同。
MediaCodec可以处理编码,也可以处理解码;可以处理音频,也可以处理视频,里面有软解(cpu),也有硬解(gpu),具体手机Android系统一般会写在media_codecs.xml,不同手机位置不一样.根据我的经验,大多数手机是在/system/etc/目录下.这里主要写的是视频解码.
Android MediaCodec内部大致结构
如上图所示,mediacodec内部有两种缓冲,一种是InputBuffer,另一种是OutputBuffer.两种缓存的大小一般是底层硬件的代码解决定.解码过程中,Client需要不断查询InputBuffer和OutputBuffer的情况,如果InputBuffer有空闲,则应放入相应的码流:如OutputBuffer有输出,则应该及时去消费视频帧并且释放.codec则内部自启线程,也是不断的查询InputBuffer和OutputBuffer的情况,如果OutputBuffer有空闲并且有未处理的InputBuffer,则去解码一帧;
Android MediaCodec启动流程
1.判断Android Runtime版本
由于ndk接口只有在Android5.0以上才有,我们先判断Android版本,如果版本号在5.0以上则使用Ndk接口,否则,使用JAVA反调的方式.
2.创建解码器
mediaCodec提供创建解码器的方式有两种,一种比较简单的方式是通过MIME直接创建解码器,MIME是解码器类型,例如创建264解码器的话只需要调用如下函数即可:
AMediaCodec_createDecoderByType("video/avc")
如果手机上264解码器不止一个(通常手机上会有一个硬解码器和一个Google的软解码器),那么MediaCodec会按照默认的顺序选择一个.当然这个顺序可以更改.手机一般情况下,是默认选用硬解的.
如果想精确的选择创建的解码器,可以通过名字创建:
AMediaCodec_createCodecByName("OMX.video.decoder.avc")
3.配置解码器
AMediaCodec_configure(handle,format,surface, crypto, flag)
这个函数有两个需要注意,一个是mediaFormat,另一个是surface.cypto是加密相关的,我们这里每太用到.flag是编码应该注意的参数,解码一般填0.
mediaFormat 是Client需要提前告诉解码器的一些参数格式,包括width,height, sps, pps等。例如:
AMediaFormat* videoFormat=AMediaFormat_new();AMediaFormat_setString(videoFormat,"mime","video/avc");AMediaFormat_setInt32(videoFormat, AMEDIAFORMAT_KEY_WIDTH, width);// 视频宽度 AMediaFormat_setInt32(videoFormat, AMEDIAFORMAT_KEY_HEIGHT, height);// 视频高度 AMediaFormat_setBuffer(videoFormat,"csd-0", sps, spsSize);// sps AMediaFormat_setBuffer(videoFormat,"csd-1", pps, ppsSize);// pps
我发现如果直接将sps,pps放到第一个I帧之前,format不设置,也能解码成功。如果提前设置的话,configure函数应该可以提前检查参数,如果参数不支持,则提前返回失败。
surface参数直接决定了解码器
的工作方式。我们如果传入一个nativeWindow,则解码器接完之后的AImage将会通过Release方法直接渲染到surface上,然后就有画面了。这样省去了图像从GPU到CPU,CPU再到GPU的拷贝,效率较高;如果我们传入nullptr,我们则需要通过接口将图像地址获取。这样有个好处就是后面可以接一些CPU的图像处理,达到我们的要求,然后再进行图像渲染。
4.启动解码器
这个比较简单。就是Start接口调用一下即可。如果没有configure,则会失败。
AMediaCodec_start();
数据流程
启动之后就开始送数据,取数据进行解码了。根据之前的大致结构描述,数据流程也基本分为两步,送数据主要围绕InputBuffer展开,取数据主要围绕OutputBuffer展开。为了达到最佳实践,我们发现最好是用两个线程分别处理这两个过程,以免互相影响导致效率降低。
1.送数据
送数据分3步骤,第一步,获取InputBufferIndex.这步的主要目的是看看InputBuffer是不是满了。如果InputBuffer满,则上游应该进行相应的数据缓存操作。
MediaCodec_dequeueInputBuffer(handle, 2000);
第二步,获取InputBuffer地址,然后填数据:
AMediaCodec_getInputBuffer(handle, idx, &size);
第三步,告诉MediaCodec我们数据填好了:
AMediaCodec_queueInputBuffer(handle, idx,0, bufferSize, pts,0);
这里具体一些参数这里不讲了,详情Android Developer上有详细解释。我这里是有个疑问,为啥要获取InputBuffer地址,然后填数据再告诉它填好了,这样需要两个函数getInputBuffer和queueInputBuffer。如果直接用一个函数SendDataToInputBuffer代替不更好么?
这里要提一句的是Android 硬解码只支持AnnexB 格式的码流,也就是 00 00 00 01 开头的码流,如果是avcc 字节长度开头的码流,需要提前转一下。
取数据相对送数据复杂一些,第一步获取index,这是看看有没有解码好的帧:
AMediaCodec_dequeueOutputBuffer(handle, &info, 2000);
如果有,则取帧。若surface填nullptr,则可以通过接口获取数据地址:
AMediaCodec_getOutputBuffer(handle, idx, &outsize);
如果surface之前填有值,我们可以通过release接口直接将图像渲染到Surface上:
AMediaCodec_releaseOutputBuffer(handle, idx, bRender);
取数据需要注意一点的就是getOutputBuffer时候可能会获取到一些负值。并且这些负值都是很有意义的。例如AMEDIACODEC_INFO_OUTPUT_FORMAT_CHANGED就表示了输出格式发生改变等等。我们需要关注这些信息,及时更新解码器的输出格式。
最简单的方式,就是configure时候Surface填null,然后将解码后的数据拷贝出来。这样做的有点很明显,就是跟之前的软解逻辑基本一样,外面并不需要改变太多,之前的VideoProcess
也能接着用,也不需要渲染引擎的配合,封装性好。缺点是多了一次解码器内存到自己内存的拷贝。
如果我们针对业务一的拷贝做优化,减少拷贝,这就是第二种业务路线。我们可以利用解码器的缓存进行输出存储。也就是说,我们调用ouputBuffer之后,获得输出缓存index,并不着急拷贝出图像。而是等到渲染时候,调用GetOutputBuffer获取图像指针,然后调用Image2D,进行生成gpu纹理。
如果我们configure传surface,我们可以通过gpu传递的方法,直接进行渲染,这样可以减少GPU <->
CPU之间的内存拷贝。首先configure时候传surface,我们调用ouputBuffer之后,获得输出缓存index,得到渲染时候,直接调用releaseOutputBuffer(handle,idx,true),则解码器的图像直接渲染到surface图像上了。
这样虽然效率高,但是弊端也很明显,第一,那就是图像后处理做不了。第二,这种方案依赖解码器缓存,这会带来一些问题。如果解码器被提前析构,则缓存内容都没有了。又或者一些播放业务逻辑对解码器缓存要求较多(比如倒放),这也做不了。
4.利用GPU Image,SurfaceTexture类渲染到OpenGL管线
针对业务路线3,Android系统也考虑到这个问题,提供我们一种方案做折中。我们可以先建立自己的OpenGL环境,然后从建立Texture,通过Texture建立SurfaceTexture,然后取出surface,进行Configure。这样,MediaCodec的Release就渲染到SurfaceTexture类了。然后我们调用Update方法,就同步到OpenGL的Texture上了。之后可以接各种后处理,然后swapbuffer进行显示等等。
这样处理得话,基本所有的业务逻辑都可以满足。但是有一个小问题就是流畅性不足。具体为:当输出一个surface,并且OpenGL还没消费这个surface时候,解码输出是被阻塞的。也就是说,outputBuffer和OpenGL
cosume 这个surface必须串行执行。如果并行,则会有覆盖的问题。
因此我们可以采取一步小调整:将OpenGL得到的Texture 拷贝一份(是GPU->GPU复制,纹理复制)。这样OpenGL就不会阻塞解码输出了。但是代价会带来拷贝性能损耗。
Android 6.0 (API23)新增了一个接口 ——
setOutputSurface。顾名思义,这个可以动态的设置输出的Surface。这就完美解决了上面的问题。具体为,我们可以事先建立多个Texture,然后OutputBuffer时候循环输出到任意一个空闲Texture并标记为带数据,当OpenGL消费了图像之后,将Texture回归空闲。这样相当于在OutputBuffer和OpenGL消费之间建立了一个纹理缓冲。可以完成多线程并行的需求。
缺点很明显就是需要Android 6.0才能支持,不过现在通过Android统计面板https://developer.android.com/about/dashboards/
能看到大部分手机都在Android 6.0之上。