Intel h264解码缓存分析

一、问题

标准GoP参考关系

当h264流没有b帧、帧参考关系如上图所示时,期望输入1帧数据给解码器后,解码器能立即输出解码帧。但事实上intel解码器会缓存若干帧后才输出解码帧,引起了延迟。

二、分析结果

由于解码器解码1帧后,不确定后续是否b帧、且p帧也可能乱序,因此默认情况下intel解码器会等到DPB(Decoded Picture Buffer)满了才输出解码帧。为了降低缓存导致的延迟,需要改变编码器参数:

1、将sps.pic_order_cnt_type设置为2(pic_order_cnt_type=2时,显示顺序与解码顺序一致,解码器会立即输出解码帧)  or

2、将MaxDpbSize设置为1,MaxDpbSize限制了DPB的大小

三、h264相关知识

1、显示顺序与解码顺序

解码顺序由frame_num决定,frame_num存在slice header中,默认情况下frame_num=上一个参考帧的frame_num+1。

显示顺序由POC决定,有3种计算方式:

type 0,POC最低有效位记录在slice header中,最灵活,但是需要的数据量最大

type 1,在sps中指定参考帧与上一个参考帧的增量、非参考帧和上一个参考帧的增量,每个非参考帧可以指定Delta POC。POC offset(和上一个参考帧的POC的差值) = sps中指定的增量 + Delta POC。

例子中参考帧与上一个参考帧的增量=6,非参考帧和上一个参考帧的增量=-4

type 2,POC=frame_num,显示顺序和解码顺序一样

2、如何计算MaxDpbSize

sps.vui_parameters.max_dec_frame_buffering在H.264 Annex E中定义,为可选参数。

如果max_dec_frame_buffering参数存在,那么MaxDpbSize=max_dec_frame_buffering。

如果max_dec_frame_buffering参数不存在,MaxDpbSize可以通过level和画面大小求出,下面例子展示计算过程。

不同level的MaxDpbMbs

MaxDpbSize计算公式:

MaxDpbSize = min(floor(MaxDpbMbs / (PicWidthInMbs * FrameHeightInMbs)), 16) 

该h264流的level=4.2,对应的MaxDpbMbs=34816

PicWidthInMbs=(pic_width_in_mbs_minus1+1)= 120

由于frame_mbs_only_flag==1,因此FrameHeightInMbs=pic_height_in_mbs_minus1+1=68

MaxDpbSize = min(floor(34816 / (120 * 68)), 16) = 4,意味着intel解码器会缓存4个解码后的帧。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容