【一点资讯】Parquet与ORC:高性能列式存储格式 www.yidianzixun.com
http://www.yidianzixun.com/home?page=article&id=0EWsICwZ&up=290
hadoop深入研究:(七)——压缩 - 独自登高楼 望断天涯路 - 博客频道 - CSDN.NET
http://blog.csdn.net/lastsweetop/article/details/9162031
4种常用压缩格式在Hadoop中的应用_服务器应用_Linux公社-Linux系统门户网站
http://www.linuxidc.com/Linux/2014-05/101230.htm
目前在Hadoop中用得比较多的有lzo,gzip,snappy,bzip2这4种压缩格式,笔者根据实践经验介绍一下这4种压缩格式的优缺点和应用场景,以便大家在实践中根据实际情况选择不同的压缩格式。