MVE(Multi-View Environment),是一款开源的基于图像的三维重建软件。在三维重建中有一个非常重要的步骤就是深度图(DepthMap)的求解。MVE在重建的过程中会把它求得的深度图存放在一个文件中,但是采用二进制存储,我们无法直观的观察图片的深度信息。正好最近需要用到这个文件,所以根据MVE的文件存储说明研究了下它的存储格式,记录下来。
在MVE中,深度信息是存放在一个名为depth-L*.mvei
,*
的值会根据所撰参数的不同而不同,一般来说是图片缩小的倍数。该文件的存储格式说明很简单:
根据这个说明,可以看出整个文件从前往后由3部分构成:
1、头部信息
共11个字节。第一个字节是/x89
,用于和其他文件去分开来;接下来的9个字节就是MVE_IMAGE
这几个字符ASCII值;最后一个字节是换行符。
2、图像信息
这部分包含了图像的宽度、高度、通道、图像类型,这些信息都是由一个4字节的有符号整形表示。宽度和高度,有了长宽就知道一共有多少个像素,就知道一共有多少个深度信息;通道部分,由于深度信息只有一个通道,所以解析出来的值是1;图像类型是在mve::ImageType
这个枚举类型中的一种,查看源码发现长这样:
enum ImageType
{
IMAGE_TYPE_UNKNOWN,
/* Unsigned integer types. */
IMAGE_TYPE_UINT8, // uint8_t, unsigned char
IMAGE_TYPE_UINT16, // uint16_t
IMAGE_TYPE_UINT32, // uint32_t, unsigned int
IMAGE_TYPE_UINT64, // uint64_t
/* Signed integer types. */
IMAGE_TYPE_SINT8, // int8_t, char, signed char
IMAGE_TYPE_SINT16, // int16_t
IMAGE_TYPE_SINT32, // int32_t, int
IMAGE_TYPE_SINT64, // int64_t
/* Floating point types. */
IMAGE_TYPE_FLOAT, // float
IMAGE_TYPE_DOUBLE // double
};
一脸懵逼,说好的整型数据呢,,,然而二进制解析出来却是9。一般来说深度信息是浮点数据,也就是上面的第9个(程序员请自动从0开始数),刚好对应上,应该就是这样设定的。
3、深度信息
由图像信息部分得知了深度信息是采用float型的数据存放,也就是每个数据占用4字节,那么只需要每次读入4字节的数据,转化成为float型数据就可以得到了一个像素的深度信息,放入数组后就可以得到一个所有像素的深度信息一维数组。然后根据图像的长宽信息把所有数据转化成为二维数组就可以用了。