HDFS分布式系统Shell操作

不是操作本地文件系统,要加前缀hdfs dfs
ll -h 易读显示文件大小
hdfs面向字节切割

for i in `seq 100000`;do  echo "hello sxt $i" >> test.txt; done

hdfs dfs -D dfs.blocksize=1048576 -put test.txt

定义几个字节,根本不带商量的按字节去切
不够的,有多少算多少

[root@node003 subdir0]# ll
total 182272
-rw-r--r-- 1 root root 134217728 Nov 6 23:01 blk_1073741825
-rw-r--r-- 1 root root  1048583 Nov 6 23:01 blk_1073741825_1001.meta
-rw-r--r-- 1 root root 49377148 Nov 6 23:01 blk_1073741826
-rw-r--r-- 1 root root 385767 Nov 6 23:01 blk_1073741826_1002.meta
-rw-r--r-- 1 root root  1048576 Nov 6 23:22 blk_1073741833
-rw-r--r-- 1 root root 8199 Nov 6 23:22 blk_1073741833_1009.meta
-rw-r--r-- 1 root root 540319 Nov 6 23:22 blk_1073741834
-rw-r--r-- 1 root root 4231 Nov 6 23:22 blk_1073741834_1010.meta
[root@node003 subdir0]# head blk_1073741834
llo sxt 66231
hello sxt 66232
hello sxt 66233
hello sxt 66234
hello sxt 66235
hello sxt 66236
hello sxt 66237
hello sxt 66238
hello sxt 66239
hello sxt 66240
[root@node003 subdir0]# pwd
/var/hadoop/local/dfs/data/current/BP-226754864-[192.168.118.101](192.168.118.101)-1541433023780/current/finalized/subdir0/subdir0

元数据信息,小文件.meta 描述(用本文打开,乱码!)
严格按字节去切,没有那么复杂去考虑东西,这个世界的需求太多了(行、单词、k-v)不可能满足你们所有人!
切开了,计算层、数据需求方自己去解决这个问题!


HDFS-Shell常用操作

命令:hadoop fs
hdfs dfs
说明
-ls / 查看hdfs的根目录
-ls hdfs://master:9000/ 就是hadoop fs -ls /
-ls -R / 递归查看hdfs根目录
-mkdir /d1 创建文件夹d1
(新建文件夹之后,下面的造作默认路径就是d1)所以上传下载最好用绝对路径,不会出错
-mkdir -p /user/root 创建家目录,-p 创建多层
-put <linux-file> <hdfs-dest> 上传数据到hdfs的特定路径中
<hdfs-dest> 不存在时,路径名就是文件名
不指定<hdfs-dest> 默认是家目录
-D dfs.blocksize=1048576 -put 大文件切成多块,指定切割block大小:1M
-get <linux-source> <hdfs-dest> 把数据从hdfs下载到linux的特定路径下
-text <hdfs-file> 查看hdfs中的文件
-help 命令 帮助文档,相当于man
-rm 删除文件
-rm -R 删除文件夹
-ls(r) <path> // 显示当前目录下所有文件
-du(s) <path> // 显示目录中所有文件大小
-count[-q] <path> // 显示目录中文件数量
-mv <src> <dst> // 移动多个文件到目标目录
-cp <src> <dst> // 复制多个文件到目标目录
-rm(r) // 删除文件(夹)
-put <localsrc> <des> // 本地文件上传到hdfs
-copyFromLocal // 同put
-moveFromLocal // 从本地文件移动到hdfs
-get [-ignoreCrc] <src> <localdst> // 下载文件到本地,可以忽略crc校验
-getmerge <src> <localdst> // 将源目录中的所有文件排序合并到一个文件中
-cat <src> // 在终端显示文件内容
-text <src> // 在终端显示文件内容
-copyToLocal [-ignoreCrc] <src> <localdst> // 复制到本地
-moveToLocal <src> <localdst>
-mkdir <path> // 创建文件夹
-touchz <path> // 创建一个空文件

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 终极算法 关注微信号每天收听我们的消息终极算法为您推送精品阅读 前言 Hadoop 在大数据技术体系中的地位至关...
    Yespon阅读 130,900评论 12 168
  • 1. 使用vm安装centos7.0 可以参考文章: CentOS 7.0系统安装配置步骤及网络开启配置详解(ht...
    GuangHui阅读 3,928评论 0 2
  • 1. Zookeeper介绍: 1.基本介绍: Zookeeper: 为分布式应用提供分布式协作(协调)服务。使用...
    奉先阅读 10,093评论 0 10
  • 一、系统参数配置优化 1、系统内核参数优化配置 修改文件/etc/sysctl.conf,添加如下配置,然后执行s...
    张伟科阅读 9,240评论 0 14
  • 起早计划这两天去看爷爷。 从和姑姑的通话里,我只知道他现在状态很稳定,每日有儿女陪伴。可是一想到爷爷的生命已同指间...
    简单爱之归于朴阅读 3,244评论 0 1

友情链接更多精彩内容