zlib介绍
zlib是提供数据压缩用的函式库,由Jean-loup Gailly与Mark Adler所开发,初版0.9版在1995年5月1日发表。zlib使用DEFLATE算法,最初是为libpng函式库所写的,后来普遍为许多软件所使用。此函式库为自由软件,使用zlib授权
配置
我是从网上直接下载了zlib的dll文件的,压缩包具体有几个部分,分别是头文件zconf.h,zlib.h;lib文件zdll.lib;dll文件zlib1.dll。
配置过程很简单,包含头文件目录或引入头文件;配置VS的工程属性页,在链接器-常规-附加库目录,添加lib文件所在目录,同时在链接器-输入-附加依赖项,添加zdll.lib;最后将zlib1.dll放到Debug目录和exe文件在一起就可以了。
例子
#include <stdio.h>
#include "zlib.h"
int main()
{
/* 原始数据 */
unsigned char strSrc[] = "hello world! aaaaa bbbbb ccccc ddddd 中文测试 yes";
unsigned char buf[1024] = {0};
unsigned char strDst[1024] = {0};
unsigned long srcLen = sizeof(strSrc);
unsigned long bufLen = sizeof(buf);
unsigned long dstLen = sizeof(strDst);
printf("Src string:%s\nLength:%ld\n", strSrc, srcLen);
/* 压缩 */
compress(buf, &bufLen, strSrc, srcLen);
printf("After Compressed Length:%ld\n", bufLen);
/* 解压缩 */
uncompress(strDst, &dstLen, buf, bufLen);
printf("After UnCompressed Length:%ld\n",dstLen);
printf("UnCompressed String:%s\n",strDst);
return 0;
}
输出结果是:
Src string:hello world! aaaaa bbbbb ccccc ddddd 中文测试 yes
Length:50
After Compressed Length:49
After UnCompressed Length:50
UnCompressed String:hello world! aaaaa bbbbb ccccc ddddd 中文测试 yes
这里,zlib只是把一段内存压缩,压缩后放的另一段内存上,这离压缩文件甚至文件夹的目标还很远。
确切的说,zlib可能并不是一个针对ZIP文件的库,它只是一个针对gzip以及deflate算法的库。它提供了一个叫做minizip (contrib\minizip) 例子来给出操作 ZIP 文件的方法。
Minizip
Minizip是一个Zip和UnZip文件的附加实例。minizip.c和miniunz.c分别实际的压缩、解压程序,除去其主程序minizip.c和miniunz.c后,剩下的部分我们可以看作是zlib的一个上层库,它封装了与ZIP文件格式相关的操作。
压缩的具体操作
压缩涉及到以下api:
- zipOpen64
- zipClose
- zipOpenNewFileInZip
- zipCloseFileInZip
- zipWriteInFileInZip
使用 zipOpen64 来打开/创建一个 ZIP 文件,然后开始遍历要被放到压缩包中去的文件。针对每个文件,先调用一次 zipOpenNewFileInZip,然后开始读原始文件数据,使用 zipWriteInFileInZip 来写入到 ZIP 文件中去。zipOpenNewFileInZip 的第三个参数是一个 zip_fileinfo 结构,该结构数据可全部置零,其中 dosDate 可用于填入一个时间(LastModificationTime)。它的第二个参数是 ZIP 中的文件名,若要保持目录结构,该参数中可以保留路径。
解压的具体操作
解压缩涉及到以下api:
- unzOpen64
- unzClose
- unzGetGlobalInfo64
- unzGoToNextFile
- unzGetCurrentFileInfo64
- unzOpenCurrentFile
- unzCloseCurrentFile
- unzReadCurrentFile
打开一个ZIP文件后,需要先使用unzGetGlobalInfo64来取得该文件的一些信息,来了解这个压缩包里一共包含了多少个文件,等等。目前我们用得着的就是这个文件数目。然后开始遍历ZIP中的文件,初始时自动会定位在第一个文件,以后处理完一个后用unzGoToNextFile来跳到下一个文件。对于每个内部文件,可用unzGetCurrentFileInfo64来查内部文件名。这个文件名和刚才zipOpenNewFileInZip的第二个参数是一样的形式,所以有可能包含路径。也有可能会以路径分隔符(/)结尾,表明这是个目录项(其实压缩操作的时候也可以针对目录写入这样的内部文件,上面没有做)。所以接下来要根据情况创建(多级)目录。unzGetCurrentFileInfo64的第三个参数是unz_file_info64结构,其中也有一项包含了dosDate信息,可以还原文件时间。对于非目录的内部文件,用 unzOpenCurrentFile,打开,然后unzReadCurrentFile读取文件内容,写入到真实文件中。unzReadCurrentFile返回 0 表示文件读取结束。
参考资料
转载请注明作者Jason Ding及其出处
Github主页(http://jasonding1354.github.io/)
CSDN博客(http://blog.csdn.net/jasonding1354)
简书主页(http://www.jianshu.com/users/2bd9b48f6ea8/latest_articles)