这一章其实本来不应该这么写,但是我们大概有个概要,对于学习是很快的,但是真的在阅读代码的时候,是不能这么看的;不过也不要紧,学习嘛
看一下HM编码器,里面的头文件和C++文件的作用:
文件的功能以及作用:
AccessUnit.h 定义了存取单元(或者说访问单元),实质是一个类型为NALUnitEBSP的list
NAL.h 定义了NALUnit(NAL单元)和NALUnitEBSP(EBSP类型的NAL单元)
AnnexBwrite.h 实现了把存取单元写入外部数据队列的功能
CommonDef.h 定义各种宏
ContextModel.h/ContextModel.cpp 定义了熵编码需要的上下文模型
ContextModel3DBuffer.h/ContextModel3DBuffer.cpp 定义了熵编码上下文模型需要的3维缓存区
ContextTables.h 定义各种上下文所需的表格,例如二进制化、熵编码等等
encmain.cpp 编码器的主函数
libmd5.h/libmd5.cpp/MD5.h md5的实现
NALwrite.h/NALwrite.cpp 定义了输出的NAL单元(OutputNALUnit)、实现把NAL单元写到外部输出流中(std::ostream)
program_options_lite.h/program_options_lite.cpp 编码器的选项配置
SEI.h/SEI.cpp 图像增强信息方面
SEIwrite.h/SEIwrite.cpp 写SEI信息到比特流中
SyntaxElementWriter.h/SyntaxElementWriter.cpp 语法元素写入器
TAppEncCfg.h/TAppEncCfg.cpp 编码器应用程序配置类
TAppEncTop.h/TAppEncTop.cpp 继承自TAppEncCfg,编码器应用程序顶层类(或者说编码器的主类)
TComBitCounter.h/TComBitCounter.cpp 比特计数器
TComBitStream.h/TComBitStream.cpp 比特流
TComCABACTables.h/TComCABACTables.cpp定义了CABAC所需要的各种表格
TComDataCU.h/TComDataCU.cpp CU(编码单元的定义)
TComInterpolationFilter.h/TComInterpolationFilter.cpp 插值过滤器
TComList.h 公用的列表的定义,继承自std的list
TComLoopFilter.h/TComLoopFilter.cpp 环路滤波器的实现
TComMotionInfo.h/TComMotionInfo.cpp 运动信息的实现
TComMv.h mv(运动向量)的定义
TComPattern.h/TComPattern.cpp 公共的模式类,定义了YUV三个颜色分量的方位方法和相邻像素的访问方法
TcomPic.h/TcomPic.cpp 是图片类,它包含TComPicSym(图像符号类)和TComPicYuv(yuv数据类:包括原始数据,预测数据、惨差数据)
TComPicSym.h/TComPicSym.cpp 定义了图像符号类,定义了从图像到片和cu的访问方式
TComPicYuv.h/TComPicYuv.cpp 图像的yuv数据类:包括原始数据,预测数据、残差数据
TComPicYuvMD5.cpp 图像的yuv的md5的实现
TComPrediction.h/TComPrediction.cpp 预测的实现(帧内预测/帧间预测)
TComRdCost.h/TComRdCost.cpp率失真代价
TComRdCostWeightPrediction.h/TComRdCostWeightPrediction.cpp 带率失真权重的预测
TComRom.h/TComRom.cpp 全局的变量和函数
TComSampleAdaptiveOffset.h/TComSampleAdaptiveOffset.cpp SAO的定义和实现
TComSlice.h/TComSlice.cpp 片的定义和实现
TComTrQuant.h/TComTrQuant.cpp变换和量化的实
TComWeightPrediction.h/TComWeightPrediction.cpp带权重的预测
TComYuv.h/TComYuv.cpp TComPicYuv和TComYuv的区别,TComYuv可以看作是一个方便操作YUV的类,主要用于预测阶段,从TComPicYuv产生而来,TComYuv的作用没有TComPicYuv那么大
TEncAnalyze.h/TEncAnalyze.cpp 编码器分析类(性能分析类)
TEncBinCoder.h 二进制编码器的定义(定义了二进制化和熵编码的一些类)
TEncBinCoderCABAC.h/TEncBinCoderCABAC.cpp CABAC二进制编码器
TEncBinCoderCABACCounter.h/TEncBinCoderCABACCounter.cpp CABAC比特计数器
TEncCavlc.h/TEncCavlc.cpp CAVLC熵编码器
TEncCfg.h 编码器的基础配置类
TEncCu.h/TEncCu.cpp CU编码器
TEncEntropy.h/TEncEntropy.cpp 熵编码器
TEncGOP.h/TEncGOP.cpp 图像组编码器
TEncPic.h/TEncPic.cpp 图像编码器
TEncPreanalyzer.h/TEncPreanalyzer.cpp 预测分析器编码器
TEncRateCtrl.h/TEncRateCtrl.cpp 速率控制器(帧速率、比特速率等等)
TEncSampleAdaptiveOffset.h/TEncSampleAdaptiveOffset.cpp SAO编码器
TEncSbac.h/TEncSbac.cpp SBAC编码器(SBAC是CABAC的改进,是并行的CABAC算法)
TEncSearch.h/TEncSearch.cpp 运动搜索的实现
TEncSlice.h/TEncSlice.cpp 片编码器
TEncTop.h/TEncTop.cpp 公共的编码器类(与编码器应用类不一样,编码器应用类是一个包装的接口类)
TvideoIOYuv.h/TvideoIOYuv.cpp YUV的I/O类,是用来读取yuv文件的类,读取出来之后把数据放到TComPicYuv中
TypeDef.h 基础类型的定义
WeightPredAnalysis.h/WeightPredAnalysis.cpp 带权预测分析
TCom和TEnc的区别在于,TEnc一般是管理器或者编码器,而TCom则是数据存储类或者算法实现类,例如TEncCu是CU编码器类,而TComDataCU则是CU的数据类(或者说CU数据的操作类,因为实际的数据仍然存放在TComPicYuv中)
简单介绍一下HM的基本工作:
TAppEncTop的encode函数调用了compressGOP这个函数,这是一个非常重要的函数,它对一个图像组进行编码。
compressGOP函数(这个函数将近2000行,我就不贴上来了。。。):
1、调用xInitGOP设置图像组中帧的数量
2、设置一些图像增强信息
3、进入一个大的for循环,对图像组的每一帧图像进行处理
3.1、说明一下GOPEntry并不表示一个图像组,而是表示某一帧对应的GOP(即图像组)的信息,它包含了这个帧的参考帧等重要的信息。
3.2、调用selectReferencePictureSet、createExplicitReferencePictureSetFromReference、applyReferencePictureSet、arrangeLongtermPicturesInRPS、setRefPicList、setRefPOCList、setList1IdxToList0Idx等几个函数,设置当前帧的参考图像集、参考帧、并对这些参考帧进行排序等等,比较复杂的功能。
3.3、进入一个while循环,对帧的每一片(slice)进行编码,主要是调用compressSlice来选出最优的参数,以及预测、变换、量化的编码工作,然后进行环路滤波,最后调用encodeSlice对其进行熵编码
4、一些收尾工作!
接下来的内容比较关键,代表的是在工程里,函数和变量的命名规范:
TcomPic 是图片类,它包含TComPicSym(图像符号类)和TComPicYuv(yuv数据类:包括原始数据,预测数据、残差数据)
TvideoIOYuv 是用来读取yuv文件的类,读取出来之后把数据放到TComPicYuv中
TComPicSym中则存放了指向片(TComSlice)的二级指针,和指向CU(TComDataCU)的二维指针,其实片和CU的实际数据仍然存放在TComPicYuv中
TEncEntropyIf是熵编码算法的纯虚类
TEncSbac(TEncEntropyIf的子类)是SBAC熵编码算法的实现,SBAC是CABAC算法的一个改良
TencCavlc(TEncEntropyIf的子类) 是CAVLC熵编码算法的实现
TEncEntropy是熵编码器类,它和TEncEntropyIf的区别是,TEncEntropy是一个算法的管理和控制类,而TEncEntropyIf则是具体算法的实现类
TEncBinIf是二进制编码的纯虚类(二进制编码和熵编码是有区别的,熵编码需要用到二进制编码,还有一些其他没有熵编码的元素也可能用到二进制编码类)
TencBinCABAC(TEncBinIf的实现) 二进制CABAC类
TcomBitIf是比特流虚类
TComOutputBitstream(TcomBitIf的子类)输出的比特流类
TComBitCounter(TcomBitIf的子类)比特流计数器类
TEncGOP是图像组处理类,也就是图像组编码器类(它的m_pcListPic存放图像组数据)
GOPEntry是图像组对象类,它包含了图像组必要的一些信息,TEncGOP处理的对象就是他
TCom和TEnc的区别在于,TEnc一般是管理器或者编码器,而TCom则是数据存储类或者算法实现类,例如TEncCu是CU编码器类,而TComDataCU则是CU的数据类(或者说CU数据的操作类,因为实际的数据仍然存放在TComPicYuv中)
TComPicYuv和TComYuv的区别,TComYuv可以看作是一个方便操作YUV的类,主要用于预测阶段,从 TComPicYuv产生而来,TComYuv的作用没有TComPicYuv那么大
一些其他数据类型的定义:
(1)Pxl 是8比特的像素类型
(2)Pel 是16比特的像素类型
(3)TCoeff 是变换系数的数据类型(int)
(4)TComPicSym图像符号
(5)枚举类型SliceConstraint,定义了和片相关的一些常量
(6)枚举类型SAOComponentIdx,定义了SAO组件的索引
(7)枚举类型SAOMode,定义了SAO的模式
(8)枚举类型SAOModeMergeTypes,定义了SAO模式合并的类型
(9)枚举类型SAOModeNewTypes定义了SAO模式的新类型
(10)枚举类型SAOEOClasses定义了SAO的EO类型
(11)结构体SAOOffset定义了SAO的偏移
(12)结构体SAOBlkParam定义了SAO块的参数
(13)枚举DFunc定义了失真的计算函数
(14)枚举RefPicList定义了参考列表
(15)枚举TextType定义图像纹理的类型(即亮度,色度等)
(16)枚举MVP_DIR定义了运动矢量预测的方向
(17)枚举CI_IDX定义了SBAC率失真方面的优化
(18)枚举COEFF_SCAN_TYPE定义了系数的扫描方式
以TCom开头的数据结构是存放数据和信息的类;以TEnc开头的数据结构则是编码功能实现的类;例如TComPic是存放图像数据信息的类,而TEncPic则是实现帧编码功能的类;以TApp开头的的是应用程序的入口。
以TApp开头的类:
(1)TAppEncCfg 编码器配置信息类,定义了一大堆的配置信息
(2)TAppEncTop HEVC编码器应用对象类,继承自TAppEncCfg,实现了整个编码框架的入口,读取文件,初始化,编码、写数据以及结束处理等操作。
以TEnc开头的类:
(1)TEncCfg 编码过程中的配置信息,TAppEncCfg的配置信息直接从文件中读取,而TEncCfg得信心则是通过计算或者判定得到
(2)TEncTop 编码主类,实现编码的主要入口。
TApp和TEnc的关系:TAppEncTop调用TEncTop,TEncTop再调用其他的各个部分编码功能,而TAppEncTop继承自TAppEncCfg,TEncTop继承自TEncCfg
数据和编码的类:
(1)TVideoIOYuv 用于打开、关闭、读写YUV文件。
(2)TComYuv 实现了内存YUV数据,指向YUV三个内存分量的指针,以及它们的宽高信息
(3)TComPicYuv 对TComYuv来说是更加仔细的实现(包括了边缘填充)
(3)GOPEntry 存放了图像组的信息,例如poc,参考图像列表等等
(4)TEncGOP 实现了对图像组的编码功能
(5)TComPic 图像数据类,包含TComPicYuv和TComPicSym的对象
(6)TComPicSym是图像符号类,里面存放了更加详细的图像信息
(7)TComSlice 存放了条带(片)的数据信息
(8)TEncSlice 实现片的编码功能
(9)TComDataCU 存放CU(编码单元)的数据信息
(10)TEncCu 实现了CU的编码功能
(11)TEncSearch 实现了运动搜索的功能
(12)TComPattern 提供了相邻像素的访问方法
(13)TComMv 定义了MV(运动向量)
(14)TComPrediction 实现了预测的功能
(15)TComRdCost 实现了率失真的计算功能
(16)TComRom.h 文件里定义全局的函数
(17)TComInterpolationFilter 实现了内插值滤波功能
(18)TComLoopFilter 实现了环路滤波
(19)TComSampleAdaptiveOffset 实现了SAO方面的计算
(20)TComTrQuant 实现了变换和量化的功能
(21)TEncAnalyze 一个统计信息分析类
(22)TEncPreanalyzer 源文件分析类,主要用来计算图像的特征
(23)TEncRateCtrl 码率控制类
(24)TEncSampleAdaptiveOffset SAO编码实现类
熵编码的类:
(1)TComBitIf 是比特编码的虚基类,是比特编码的基础接口(If就是Interface)。比特编码包括输出比特流,比特计数器、SBAC编码、CABAC编码等等
(2)TComOutputBitstream 是比特流输出类,主要用于比特流的输出,写到文件或者buffer中
(3)TComInputBitstream 比特流输入类(它不是TComBitIf的子类)
(4)TComBitCounter 比特计数器,用于统计比特的数量
(5)TEncBinIf 二进制编码接口类
(6)TEncBinCABAC CABAC编码实现类
(7)TEncBinCABACCounter CABAC比特计数实现类
(8)TEncEntropyIf 熵编码器的接口类
(9)TEncCavlc CAVLC熵编码实现类
(10)TEncSbac SABAC熵编码器实现类
由此可见熵编码部分主要分为三个部分:二进制化编码器,熵编码器,以及比特流统计以及写出类