H.264是目前业界使用最多的视频编码格式,广泛应用于直播、视频会议、在线教育和远程医疗等领域。本篇分享的文章假设你已经对H.264已经有了一些基本的了解,例如已经知道什么是SPS和PPS,知道什么是I帧、P帧和B帧,知道了NALU的抽象概念,知道了Profile和Level的概念,否则本篇文章可能暂时不适合你。
Profile和Level是H.264中一个非常重要的概念,Profile用于确定视频编码过程中帧间压缩使用的算法(例如是否包含B帧、CABAC支持、颜色空间支持等),Profile越高,就说明采用了越高级的压缩特性,对应的对编解码硬件的要求也越高;Level是对视频本身特性的一些描述(码率,分辨率,fps等),Level越高,视频的码率、分辨率、fps越高。下面两张图来自维基百科,分别对应了不同的Profiel和Level支持的能力和特性。
对于H.264的Profile和Level比较专业化(你这么去描述,行业里的人会认为你很专业)的描述是:Profile@Level,例如Main@4.2,Baseline@3.1,High@5.0。
我们知道,H.264对于计算机来说,本质上其实就是一连串随着时间推移的比特流,至于这些比特流分别代表什么意义,制定H.264标准的那帮家伙给定义好了,大家只要都遵守这个标准就可以了。我们如何从一连串的H.264比特流里快速地读出其Profile和Level呢,这是本篇的重点。
在H.264标准中,Profile和Level信息是定义在SPS NALU中的,SPS又是H.264的第一个NALU,所以知道了SPS这个NALU中每一个字节的意义就可以很快地从中分辨出Profile和Level。
下图是H.264官方标准中对于SPS RBSP的定义。
PS:H.264的官方标准定义参考:H.264标准
根据H.264标准定义,SPS的RBSP,第1个字节和3个字节分别代表profile_idc和了level_idc信息。如果加上起始码(Annex-B格式)的3或4个字节,再加上1个字节的NALU Header,那一个H.264裸流的第6(或5)个字节就是profile_idc,第8(或7)个字节就是Level_idc,只要读出这两个字节的数值就可以快速方便地得到这个H.264流的Profile和Level。
profile_idc字段各值代表的含义如下。
profile_idc(十进制) | 含义 |
---|---|
66 | Baseline |
77 | Main |
88 | Extended |
100 | High (FRExt) |
110 | High 10 (FRExt) |
122 | High 4:2:2 (FRExt) |
166 | High 4:4:4 (FRExt) |
实际使用中,Baseline,Main和High Profile比较常见,我们只需要记住几个关键的数字即可。66:Baseline,77:Main,>=100:High
level_idc字段代表的含义如下。
level_idc(十进制) | 含义 |
---|---|
10 | 1 (supports only QCIF format and below with 380160 samples/sec) |
1 | 1.1 (CIF and below. 768000 samples/sec) |
12 | 1.2 (CIF and below. 1536000 samples/sec) |
13 | 1.3 (CIF and below. 3041280 samples/sec) |
20 | 2 (CIF and below. 3041280 samples/sec) |
21 | 2.1 (Supports HHR formats. Enables Interlace support. 5068800 samples/sec) |
22 | 2.2 (Supports SD/4CIF formats. Enables Interlace support. 5184000 samples/sec) |
30 | 3 (Supports SD/4CIF formats. Enables Interlace support. 10368000 samples/sec) |
31 | 3.1 (Supports 720p HD format. Enables Interlace support. 27648000 samples/sec) |
32 | 3.2 (Supports SXGA format. Enables Interlace support. 55296000 samples/sec) |
40 | 4 (Supports 2Kx1K format. Enables Interlace support. 62914560 samples/sec) |
41 | 4.1 (Supports 2Kx1K format. Enables Interlace support. 62914560 samples/sec) |
42 | 4.2 (Supports 2Kx1K format. Frame coding only. 125829120 samples/sec) |
50 | 5 (Supports 3672x1536 format. Frame coding only. 150994944 samples/sec) |
51 | 5.1 (Supports 4096x2304 format. Frame coding only. 251658240 samples/sec) |
Level很简单,level_idc的十进制数值除以10即是H.264的Level值。
结合上面三个表格即可快速计算出Profile和Level信息,下面是三个例子。
例子:码流1
Profile = 0x42 = 66 = Baseline, Level = 0x1F = 31 = 3.1; 所以该码流可以描述为Baseline@L3.1
例子:码流2
Profile = 0x4D = 77 = Main, Level = 0x28 = 40 = 4.0; 所以该码流可以描述为Main@L4.0
例子:码流3
Profile = 0x64 = 100 = High, Level = 0x28 = 40 = 4.0; 所以该码流可以描述为High@L4.0