hdfs读取中文乱码

乱码这个要从两方面来处理,首先是源头,由于HADOOP默认的中文编码是UTF-8,因此最好我们上传的文件的编码格式也设置成UTF-8。

接着就是下载了
FSDataInputStream inputStream = hdfsService.open("/xxx/test.txt");

BufferedReader reader = new BufferedReader(new InputStreamReader(inputStream)); // 解决乱码
String line = null;
StringBuffer sb = new StringBuffer();
while((line = reader.readLine())!=null){
System.out.println(line);
sb.append(line);
}

如果直接用inputStream.readLine()来读取,就会又乱码情况,需要用InputStreamReader来进行一次转译。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

友情链接更多精彩内容