Java 读取HDFS上的Lzo格式文件

pom配置

<dependency>    
    <groupId>org.anarres.lzo</groupId>    
    <artifactId>lzo-hadoop</artifactId>    
    <version>${lzo.version}</version>
</dependency>

Lzo配置

Configuration configuration = new Configuration();
configuration.set("io.compression.codecs", "com.hadoop.compression.lzo.LzoCodec");
configuration.set("fs.defaultFS","");

Java代码

LzopCodec lzo = null;
try {    
    lzo = new LzopCodec();        
    lzo.setConf(HDFSUtils.getLzoDefaultConf()); //为Lzo配置项
    is = lzo.createInputStream(fs.open(lzoFilePath)); // fs为FileSystem对象
    isr = new InputStreamReader(is);    
    reader = new BufferedReader(isr);    
    while ((line = reader.readLine()) != null) {        
        // Process   
    }
}
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容