TIFF 文件格式
本文档基于 TIFF version 6.0 描述
附录:
TIFF 规范 版本6.0.pdf TIFF Specification, revision 6.0
TIFF6.pdf 百度网盘链接
标签图像文件格式(Tag Image File Format,TIFF)是一种灵活的位图格式,主要用来存储包括照片和艺术图在内的图像,最初由 Aldus 公司与微软公司一起为 PostScript 打印开发。TIFF 与 JPEG 和 PNG 一起成为流行的高位彩色图像格式。
TIFF文件以 .tif 或 .tiff 为扩展名。其数据格式是一种3级体系结构,TIFF 文件内部结构可以分成三个部分,分别是:文件头信息区(IFH)、图像文件目录(IFD)和图像数据区。其中所有的标签都是以升序排列,这些标签信息是用来处理文件中的图像信息的。
由于 TIFF 文件中使用的偏移量为 4 个字节,所以,tif 文件最大为 4GB,而新的 BigTIFF 文件格式是为打破此限制而设计的格式,此处不表。
图像文件头 IFH
图像头文件(Image File Header 简称 IFH),IFH 数据结构包含 3 个成员共计8个字节,如下所示:
Offset | DataType | Value |
---|---|---|
0 | Word | Byte order indication |
2 | Word | Version number (always 42) |
4 | Unsigned Long | Offset to first IFD |
详细解释:
Byte order indication:
2 字节,位于文件最开始,其取值为 "MM"(0x4d4d) 或 "II"(0x4949),"MM" 表示大字节在先的字节顺序,"II" 表示小字节在先的字节顺序。Version number:
2 字节,其值永远为 "42"(0x002a),是“为了其深刻的哲学意义”而选择的。Offset to first IFD:
4 字节,第一个 IFD 相对于文件起始位置的偏移量(对于多页 TIFF 可以存在多个 IFD)
注意:
- TIFF 文件中所使用的偏移量,都是相对于文件头位置的偏移量;
- 偏移量必须以 Word 边界开始,也就是说,所有偏移量必须为偶数。
图像文件目录(IFD)
图像文件目录(Image File Directory)是 TIFF 图中非常重要的数据结构,一个 TIFF 文件可以包含多个 IFD,这时表示此文件包含多个图像,一个 IFD 标识一个图像的属性。
IFD 包含 3 类成员,如下所示:
Offset | DataType | Value |
---|---|---|
0 | Word | Directory Entry Count |
2 | Word | Directory Entry 0 |
14 | Word | Directory Entry 1 |
Word | ||
2+(Count-1)*12 | Word | Directory Entry (count-1) |
2+(Count)*12 | Unsigned Long | Offset to next IFD |
详细解释:
Directory Entry Count:
2字节,接下来的 DE(Directory Entry)的个数Directory Entry:
12字节,表示图像的某一个属性,共有 Directory Entry Count 个Offset to next IFD:
4字节,下一个 IFD 的偏移量,如果已经是最后一个IFD,则此值为 NULL(0x00000000)
Directory Entry
Directory Entry 简称 DE, 简单的说,一个 DE 记录一个图像的属性,例如图像的 长、宽、分辨率等。其存储结构如下所示:
Offset | DataType | Value |
---|---|---|
0 | Word | Tag |
2 | Word | Type |
4 | Unsigned Long | Length |
8 | Unsigned Long | value Offset |
详细解释:
-
Tag:
2 字节,该属性的标签编号,在 IFD 中,多个 DE 的 Tag 值是升序排列的,此编号可以在 TIFF 的规范中找到,此处列出几个常用的编号(用户也可以定义自己的私有标签):TagName Decimal Hex Type Value ImageWidth 256 0x100 SHORT or LONG ImageLength 257 0x101 SHORT or LONG BitsPerSample 258 0x102 SHORT 4 or 8 Compression 259 0x103 SHORT PhotometricInterpretation 262 0x106 SHORT StripOffsets 273 0x111 SHORT or LONG RowsPerStrip 278 0x116 SHORT or LONG StripByteCounts 279 0x117 LONG or SHORT XResolution 282 0x11A RATIONAL YResolution 283 0x11B RATIONAL ResolutionUnit 296 0x128 SHORT -
Type:
2 字节,该属性的数据的数据类型,该值可以在 TIFF 规范中找到,下面列出:Value Type Description 1 BYTE 8-bit unsigned integer. 2 ASCII 8-bit byte that contains a 7-bit ASCII code; the last byte must be NUL (binary zero). 3 SHORT 16-bit (2-byte) unsigned integer. 4 LONG 32-bit (4-byte) unsigned integer. 5 RATIONAL Two LONGs: the first represents the numerator of a fraction; the second, the denominator. 6 SBYTE An 8-bit signed (twos-complement) integer. 7 UNDEFINED An 8-bit byte that may contain anything, depending on the definition of the field. 8 SSHORT A 16-bit (2-byte) signed (twos-complement) integer. 9 SLONG A 32-bit (4-byte) signed (twos-complement) integer. 10 SRATIONAL Two SLONG’s: the first represents the numerator of a fraction, the second the denominator. 11 FLOAT Single precision (4-byte) IEEE format. 12 DOUBLE Double precision (8-byte) IEEE format. Length:
4 字节,数据的数量,注意,此处为数据的数量而不是数据的字节数valueOffset:
4 字节,如果数据的数量乘以数据类型的字节长度(即实际数据的字节数)小于等于 4,则此处存储数据,否则,此处存储数据位置的偏移量(相对于文件头的偏移量)
其文件结构总览如下图所示:
图像数据例子
TIFF 文件的 IFD 并不一定紧跟在 IFH 后面,相反,它常常位于图像数据的后面,即 TIFF 图像文件的一般组织形式是:
IFH -- 图像数据 -- IFD
下面我们制作一个 TIFF 格式的文件进行简单分析
用 画图 软件绘制一个 7*9 像素的图像,保存为 TIFF 格式
放大截图显示为:
其文件的实际内容为(16进制):
Offset | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | a | b | c | d | e | f |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0000 0000 | 49 | 49 | 2a | 00 | ca | 00 | 00 | 00 | 80 | 3e | 14 | 2a | 40 | 39 | 78 | b6 |
0000 0010 | 00 | 84 | 26 | 61 | 41 | f8 | 61 | 22 | 1d | 08 | 00 | 3e | 56 | 2b | 37 | f3 |
0000 0020 | b9 | de | 04 | 16 | 0a | cb | 48 | a4 | 40 | 92 | 3c | 86 | 90 | 44 | 0c | e4 |
0000 0030 | c7 | 1b | d1 | ee | 03 | 7d | 82 | 0c | c1 | 71 | 10 | 84 | aa | 4e | 65 | 0f |
0000 0040 | 47 | c5 | 00 | 00 | 04 | 18 | 91 | 48 | bf | dd | 4e | a0 | 02 | a1 | 50 | a2 |
0000 0050 | 14 | 0a | 00 | cb | 45 | 73 | 6a | 6a | 1d | 84 | 3f | 58 | ec | 77 | fa | d9 |
0000 0060 | 6c | 20 | 71 | 80 | 9b | 02 | 40 | c8 | 3c | f6 | 63 | 6a | 42 | 1e | d0 | 87 |
0000 0070 | e1 | 9d | 2e | c2 | 01 | bc | c2 | a0 | 10 | 1b | f8 | b0 | 5d | 7d | 09 | c1 |
0000 0080 | 4d | e0 | a8 | 1c | 03 | 08 | 01 | cf | 9f | ec | 87 | 3b | 64 | 20 | 10 | 00 |
0000 0090 | 0f | 49 | 2f | 20 | 50 | 0c | 0f | 10 | 10 | 83 | 03 | 6a | e5 | 73 | fd | aa |
0000 00a0 | ec | 71 | bd | 5f | 6f | 91 | c9 | 39 | ca | f7 | 7e | be | 42 | 00 | 60 | 66 |
0000 00b0 | 41 | f3 | 0e | 7f | 87 | 03 | 8f | f2 | ea | 15 | 9e | fd | 7f | bf | 5d | cf |
0000 00c0 | a7 | 93 | d5 | f8 | f7 | 7c | bf | 9f | 70 | 10 | 0f | 00 | fe | 00 | 04 | 00 |
0000 00d0 | 01 | 00 | 00 | 00 | 00 | 00 | 00 | 00 | 00 | 01 | 04 | 00 | 01 | 00 | 00 | 00 |
0000 00e0 | 07 | 00 | 00 | 00 | 01 | 01 | 04 | 00 | 01 | 00 | 00 | 00 | 09 | 00 | 00 | 00 |
0000 00f0 | 02 | 01 | 03 | 00 | 03 | 00 | 00 | 00 | 84 | 01 | 00 | 00 | 03 | 01 | 03 | 00 |
0000 0100 | 01 | 00 | 00 | 00 | 05 | 00 | 00 | 00 | 06 | 01 | 03 | 00 | 01 | 00 | 00 | 00 |
0000 0110 | 02 | 00 | 00 | 00 | 11 | 01 | 04 | 00 | 01 | 00 | 00 | 00 | 08 | 00 | 00 | 00 |
0000 0120 | 15 | 01 | 03 | 00 | 01 | 00 | 00 | 00 | 03 | 00 | 00 | 00 | 16 | 01 | 04 | 00 |
0000 0130 | 01 | 00 | 00 | 00 | 09 | 00 | 00 | 00 | 17 | 01 | 04 | 00 | 01 | 00 | 00 | 00 |
0000 0140 | c2 | 00 | 00 | 00 | 1a | 01 | 05 | 00 | 01 | 00 | 00 | 00 | 8a | 01 | 00 | 00 |
0000 0150 | 1b | 01 | 05 | 00 | 01 | 00 | 00 | 00 | 92 | 01 | 00 | 00 | 1c | 01 | 03 | 00 |
0000 0160 | 01 | 00 | 00 | 00 | 01 | 00 | 00 | 00 | 28 | 01 | 03 | 00 | 01 | 00 | 00 | 00 |
0000 0170 | 02 | 00 | 00 | 00 | 3d | 01 | 03 | 00 | 01 | 00 | 00 | 00 | 02 | 00 | 00 | 00 |
0000 0180 | 00 | 00 | 00 | 00 | 08 | 00 | 08 | 00 | 08 | 00 | 00 | 77 | 01 | 00 | e8 | 03 |
0000 0190 | 00 | 00 | 00 | 77 | 01 | 00 | e8 | 03 | 00 | 00 |
对其进行简要解析(偏移量省略高位两个字节的0x0000):
0x0000 ~ 0x0007
IFH, 其中 最开始的两个字节内容 0x4949 为 "II", 表示此文件的字节顺序为小字节在先;接下来的两个个字节 0x2a 0x00 按照 Word 类型解析为 0x002a 为固定值 42,接下来的 4 个字节解析为 IFD 的偏移地址为:0x000000ca;0x00ca ~ 0x00cb
IFD 的起始位置,开始的两个字节解析为 0x000f, 为 Directory Entry Count, 表示下面有 15 个 Directory Entry;0x00cc ~ 0x00d7
Directory Entry 0, 开始两个字节为 Tag = 0x00fe, 表示 NewSubfileType, 具体可查看附件中的 TIFF 规范;0x00d8 ~ 0x00e3
DE 1, 开始的 2 个字节 Tag = 0x0100, 表示 ImageWidth, 接下来的 2 个字节 Type = 0x0004 表示数据格式为 LONG(32bits), 再接下来的 4 个字节 Length = 0x00000001, 表示数据个数为 1, 再接下来的 4 个字节表示此 ImageWidth = 0x00000007, 表示图像宽度为 7;0x00e4 ~ 0x00ef
DE 2, 开始的 2 个字节 Tag = 0x0101, 表示 ImageLength, 不再详述;-
0x00f0 ~ 0x00fb
DE 3, 开始的 2 个字节 Tag = 0x0102, 表示 BitsPerSample, 为每个组件的位数;接下来的 2 个字节 Type = 0x0003, 表示数据格式为 SHORT, 接下来的 4 个字节 Length = 0x00000003, 表示数据个数为 3; 此处应当计算 3 (数据格式字节数)= 32=6, 即数据为 6 个字节,所以接下来的 4 个字节保存数据的偏移量位置 value Offset = 0x00000184;- 0x0184 ~ 0x0189
此处存储 BitsPerSample 的数据,可以看到,其数据为 0x0008 0x0008 0x0008, 表示图像为3通道,每个通道的像素为 8 位深度;
- 0x0184 ~ 0x0189
0x00fc ~ 0x0107
DE 4, 开始的 2 个字节 Tag = 0x0103, 表示 Compression, 为压缩的属性,此处的值为 0x05, 表示数据是 LZW 压缩的;0x0108 ~ 0x0113
DE 5, Tag = 0x0106, 表示 PhotometricInterpretation, 值为 2 表示为 RGB 图像;-
0x0114 ~ 0x011F
DE 6, Tag = 0x0111, 表示 StripOffsets, For each strip, the byte offset of that strip. 此处 Type = 4, 表示 LONG 数据类型,Length = 0x00000001, 数据只有 1 个,其值为 0x00000008, 表示数据存放在偏移量 0x08 开始的数据处;- 0x0008~0x00c9
此处存放的数据即为图像的像素数据,验证图像像素值,其并不等于文件中的数值,应该是经过压缩的原因;
- 0x0008~0x00c9
0x0120 ~ 0x012B
DE 7, Tag = 0x0115, 表示 SamplesPerPixel, 每个像素的组件数,对于 RGB 图像此属性值为3; 查看此值确实为 3;0x012C ~ 0x0137
DE 8, Tag = 0x0116, 表示 RowsPerStrip, The number of rows in each strip (except possibly the last strip.) 一个 Strip 中的行数,此处值为 9 (此处只有 1 个 strip, 此值为 9);0x0138 ~ 0x0143
DE 9, Tag = 0x0117, 表示 StripByteCounts, For each strip, the number of bytes in the strip after compression. 字节数,此处值为 0xc2 = 194 字节;-
0x0144 ~ 0x014f
DE 10, Tag = 0x011a, 表示 XResolution, The number of pixels per ResolutionUnit in the ImageWidth direction. Type = 0x05, 表示 RATIONAL 类型(分数类型,分子分母都为LONG),length = 0x00000001, 数据个数为 1 个;Value Offset = 0x0000018a;- 0x018a~0x0191
X 方向分辨率值,分子为 0x017700 分母为 0x00003e8,所以值为:0x60=96;
- 0x018a~0x0191
-
0x0150 ~ 0x015B
DE 11, Tag = 0x011b, 表示 YResolution, Type = 0x05, length = 0x00000001, Value Offset = 0x00000192;- 0x0192~0x0199
Y 方向分辨率值,分子为 0x0x017700 分母为 0x00003e8,所以值为:0x60=96;
- 0x0192~0x0199
0x015C ~ 0x0167
DE 12, Tag = 0x011c, 表示 PlanarConfiguration,How the components of each pixel are stored. 值为 1 ,表示 1 = Chunky format. The component values for each pixel are stored contiguously. The order of the components within the pixel is specified by PhotometricInterpretation. For example, for RGB data, the data is stored as RGBRGBRGB…;0x0168 ~ 0x0173
DE 13, Tag = 0x0128, 表示 ResolutionUnit, 1 = No absolute unit of measurement. Used for images that may have a non-square aspect ratio but no meaningful absolute dimensions. 2 = Inch. 3 = Centimeter. Default = 2 (inch); 此处值为 2;0x0174 ~ 0x017f
DE 14, Tag = 0x013d, 表示 Predictor, 此处值为 2, 此参数是与 LZW 压缩有关的参数;0x0180 ~ 0x0183
Offset to next IFD, 由于本文件中只有一幅图像,所以只有一个 IFD, 所以此处的偏移量值为 NUL = 0x00000000;
雷震西山 2019年10月29日