MVE(Multi-View Environment),是一款开源的基于图像的三维重建软件。在三维重建中有一个非常重要的步骤就是深度图(DepthMap)的求解。MVE在重建的过程中会把它求得的深度图存放在一个文件中,但是采用二进制存储,我们无法直观的观察图片的深度信息。正好最近需要用到这个文件,所以根据MVE的文件存储说明研究了下它的存储格式,记录下来。

在MVE中,深度信息是存放在一个名为depth-L*.mvei*的值会根据所撰参数的不同而不同,一般来说是图片缩小的倍数。该文件的存储格式说明很简单:

.mvei文件存储格式说明
.mvei文件存储格式说明

根据这个说明,可以看出整个文件从前往后由3部分构成:

1、头部信息

共11个字节。第一个字节是/x89,用于和其他文件去分开来;接下来的9个字节就是MVE_IMAGE这几个字符ASCII值;最后一个字节是换行符。

2、图像信息

这部分包含了图像的宽度、高度、通道、图像类型,这些信息都是由一个4字节的有符号整形表示。宽度和高度,有了长宽就知道一共有多少个像素,就知道一共有多少个深度信息;通道部分,由于深度信息只有一个通道,所以解析出来的值是1;图像类型是在mve::ImageType这个枚举类型中的一种,查看源码发现长这样:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
enum ImageType
{
IMAGE_TYPE_UNKNOWN,
/* Unsigned integer types. */
IMAGE_TYPE_UINT8, // uint8_t, unsigned char
IMAGE_TYPE_UINT16, // uint16_t
IMAGE_TYPE_UINT32, // uint32_t, unsigned int
IMAGE_TYPE_UINT64, // uint64_t
/* Signed integer types. */
IMAGE_TYPE_SINT8, // int8_t, char, signed char
IMAGE_TYPE_SINT16, // int16_t
IMAGE_TYPE_SINT32, // int32_t, int
IMAGE_TYPE_SINT64, // int64_t
/* Floating point types. */
IMAGE_TYPE_FLOAT, // float
IMAGE_TYPE_DOUBLE // double
};

一脸懵逼,说好的整型数据呢,,,然而二进制解析出来却是9。一般来说深度信息是浮点数据,也就是上面的第9个(程序员请自动从0开始数),刚好对应上,应该就是这样设定的。

3、深度信息

由图像信息部分得知了深度信息是采用float型的数据存放,也就是每个数据占用4字节,那么只需要每次读入4字节的数据,转化成为float型数据就可以得到了一个像素的深度信息,放入数组后就可以得到一个所有像素的深度信息一维数组。然后根据图像的长宽信息把所有数据转化成为二维数组就可以用了。