6、HDFS客户端操作

环境准备

  1. 配置HADOOP_HOME环境变量


    hadoop-home.png
  2. 配置Path环境变量


    path.png
  3. 创建一个Maven工程,HDFSClientDemo
  4. 导入对应依赖
     <dependencies>
        <dependency>
            <groupId>junit</groupId>
            <artifactId>junit</artifactId>
            <version>RELEASE</version>
        </dependency>
        <dependency>
            <groupId>org.apache.logging.log4j</groupId>
            <artifactId>log4j</artifactId>
            <version>2.10.0</version>
        </dependency>
        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-common</artifactId>
            <version>2.8.3</version>
        </dependency>
        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-client</artifactId>
            <version>2.8.3</version>
        </dependency>
        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-hdfs</artifactId>
            <version>2.8.3</version>
        </dependency>
    </dependencies>
  1. 添加日志
    在项目的/src/main/resource目录下,新建一个文件,名字为log4j.properties,输入以下内容
log4j.rootLogger=INFO, stdout
log4j.appender.stdout=org.apache.log4j.ConsoleAppender
log4j.appender.stdout.layout=org.apache.log4j.PatternLayout
log4j.appender.stdout.layout.ConversionPattern=%d %p [%c] - %m%n
log4j.appender.logfile=org.apache.log4j.FileAppender
log4j.appender.logfile.File=target/spring.log
log4j.appender.logfile.layout=org.apache.log4j.PatternLayout
log4j.appender.logfile.layout.ConversionPattern=%d %p [%c] - %m%n
  1. 创建包名
  2. 创建HdfsClientDemo类

常用API

文件上传

使用文件上传这个例子,测试下参数的优先级顺序
编写如下代码

    @Test
    public void testPutWithParmOrder() throws URISyntaxException, IOException, InterruptedException {
        Configuration configuration = new Configuration();
        configuration.set("dfs.replication", "1");
        fileSystem = FileSystem.get(
                        new URI("hdfs://hadoop-100:9000"),
                        configuration,
                        "hadoop");
        fileSystem.copyFromLocalFile(new Path("E:\\迅雷下载\\CentOS-7-x86_64-Minimal-1804.iso"), new Path("/user/hadoop/client/"));

    }

在/src/main/resource目录下,创建hdfs-site.xml文件,输入如下内容


创建hdfs-site.xml文件.png
<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<configuration>
    <property>
        <name>dfs.replication</name>
        <value>2</value>
    </property>
</configuration>

将configuration.set("dfs.replication", "1");注释,重新上传一个文件
将hdfs-site.xml文件删除,再次上传一个文件
结果如下图


测试参数顺序.png

参数优先级排序: 客户端代码中设置的值 > classpath下的用户自定义配置文件 >服务器的默认配置

文件下载

首先修改下获取hdfs客户端方法

    FileSystem fileSystem = null;
    @Before
    public void init() throws URISyntaxException, IOException, InterruptedException {
        fileSystem = FileSystem.get(
                new URI("hdfs://hadoop-100:9000"),
                new Configuration(),
                "hadoop");
    }

    @After
    public void close() throws IOException {
        fileSystem.close();
    }

文件下载方法

    @Test
    public void testGet() throws IOException {
        fileSystem.copyToLocalFile(new Path("/user/hadoop/client/"), new Path("G:\\test"));
    }

文件名更改

    @Test
    public void testRename() throws IOException {
        fileSystem.rename(new Path("/user/hadoop/client/CentOS-6.10-x86_64-minimal.iso"), new Path("/user/hadoop/client/CentOS6"));
    }

文件详情查看

    @Test
    public void testViewFileDetail() throws IOException {
        RemoteIterator<LocatedFileStatus> listFiles = fileSystem.listFiles(new Path("/user/hadoop/client"), true);
        while (listFiles.hasNext()) {
            LocatedFileStatus fileStatus = listFiles.next();
            System.out.println("fileStatus.getLen() = " + fileStatus.getLen());
            System.out.println("fileStatus.getReplication() = " + fileStatus.getReplication());
            System.out.println("fileStatus.getPath() = " + fileStatus.getPath());
            System.out.println("fileStatus.getGroup() = " + fileStatus.getGroup());
            System.out.println("fileStatus.getOwner() = " + fileStatus.getOwner());
            System.out.println("fileStatus.getPermission() = " + fileStatus.getPermission());
            BlockLocation[] blockLocations = fileStatus.getBlockLocations();
            for(BlockLocation blockLocation : blockLocations) {
                String[] hosts = blockLocation.getHosts();
                for(String host : hosts) {
                    System.out.println("host = " + host);
                }
                System.out.println("------------------------");
            }
        }
    }

文件和文件夹的判断

    @Test
    public void testMkdir() throws IOException {
        boolean isDirectory = fileSystem.isDirectory(new Path("/user/hadoop/client/"));
        boolean isFile = fileSystem.isFile(new Path("/user/hadoop/client/"));
        System.out.println("isFile = " + isFile);
        System.out.println("isDirectory = " + isDirectory);
        isDirectory = fileSystem.isDirectory(new Path("/user/hadoop/client/CentOS6"));
        isFile = fileSystem.isFile(new Path("/user/hadoop/client/CentOS6"));
        System.out.println("isFile = " + isFile);
        System.out.println("isDirectory = " + isDirectory);
    }

文件夹删除

    @Test
    public void testDeleteDir() throws IOException {
        fileSystem.delete(new Path("/user"), true);
    }

IO流操作

文件上传

    @Test
    public void testIoPut() throws IOException {
        FileInputStream fileInputStream = new FileInputStream(new File("E:\\chrome下载\\zookeeper-3.4.12.tar.gz"));
        FSDataOutputStream fsDataOutputStream = fileSystem.create(new Path("/user/hadoop/client"));
        IOUtils.copyBytes(fileInputStream, fsDataOutputStream, new Configuration(), true);
    }

文件下载

    @Test
    public void testIoGet() throws IOException {
        FSDataInputStream fsDataInputStream = fileSystem.open(new Path("/user/hadoop/client"));
        FileOutputStream fileOutputStream = new FileOutputStream(new File("H:/zookeeper.tar.gz"));
        IOUtils.copyBytes(fsDataInputStream, fileOutputStream, new Configuration(), true);
    }

定位文件读取

    @Test
    public void testIoPartGet() throws IOException {
        // fileSystem.copyFromLocalFile(
        //         new Path("E:\\迅雷下载\\CentOS-6.10-x86_64-minimal.iso"),
        //         new Path("/user/hadoop/client1/CentOS-6.10-x86_64-minimal.iso"));
        // 下载第一块
        FSDataInputStream inputStream = fileSystem.open(new Path("/user/hadoop/client1/CentOS-6.10-x86_64-minimal.iso"));
        FileOutputStream outputStream = new FileOutputStream(new File("H:/centos6.part1"));
        byte[] bytes = new byte[1024];
        for(int i = 0; i < 1024 * 128; i++) {
            inputStream.read(bytes);
            outputStream.write(bytes);
        }
        // 下载第二块
        outputStream = new FileOutputStream(new File("H:/centos6.part2"));
        inputStream.seek(1024 * 1024 * 128);
        for(int i = 0; i < 1024 * 128; i++) {
            inputStream.read(bytes);
            outputStream.write(bytes);
        }
        // 下载第三块
        outputStream = new FileOutputStream(new File("H:/centos6.part3"));
        inputStream.seek(1024 * 1024 * 256);
        for(int i = 0; i < 1024 * 128; i++) {
            inputStream.read(bytes);
            outputStream.write(bytes);
        }
        // 下载第四块
        outputStream = new FileOutputStream(new File("H:/centos6.part4"));
        inputStream.seek(1024 * 1024 * 384);
        IOUtils.copyBytes(inputStream, outputStream, new Configuration(), true);
    }

文件合并
type centos6.part2 >> centos6.part1
type centos6.part3 >> centos6.part1
type centos6.part4 >> centos6.part1
将centos6.part1 名字更改为 centos6.iso可以正常使用

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,616评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,020评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,078评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,040评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,154评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,265评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,298评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,072评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,491评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,795评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,970评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,654评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,272评论 3 318
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,985评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,223评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,815评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,852评论 2 351

推荐阅读更多精彩内容

  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 134,644评论 18 139
  • HDFS入门 hadoop架构 Hadoop 1.0中的资源管理方案 Hadoop 1.0指的是版本为Apache...
    依天立业阅读 1,047评论 0 1
  • 终极算法 关注微信号每天收听我们的消息终极算法为您推送精品阅读 前言 Hadoop 在大数据技术体系中的地位至关...
    Yespon阅读 129,787评论 12 168
  • 一、系统参数配置优化 1、系统内核参数优化配置 修改文件/etc/sysctl.conf,添加如下配置,然后执行s...
    张伟科阅读 3,733评论 0 14
  • 前言 多年以前一位老程序员告诉笔者代码片段(code snippets)是程序员的财富,他有一个 U 盘,里面装着...
    0x11901阅读 1,353评论 0 5