hadoop-HDFS的简单操作

【1】是什么?

http://hadoop.apache.org/docs/r1.0.4/cn/mapred_tutorial.html

    Hadoop DISTRIBUTED FILE SYSTEM,简称HDFS,是一个分布式文件系统。有一定高度的容错性,而且提供了高吞吐量的数据访问,非常适合大规模数据集
上的应用。HDFS是海量数据存储解决方案

    HDFS的设计之初就是针对超大文件的存储的,小文件不会提高访问和存储速度,反而会降低;其次它采用了最高效的访问模式,也就是经常所说的流式数据访
问,特点就是一次写入多次读取;再有就是它运行在普通的硬件之上的,即使硬件故障,也就通过容错来保证数据的高可用。

    分布式文件管理系统很多,hdfs只是其中一种。适用于一次写入多次查询的情况,不支持并发写情况,小文件不合适。


HDFS的相关概念:
  (1)Block:大文件的存储会被分割为多个block进行存储。默认为64MB,每一个blok会在多个datanode上存储多份副本,默认为3份。[其默认配置可更改]
  (2)Namenode:主要负责存储一些metadata信息,主要包括文件目录、block和文件对应关系,以及block和datanote的对应关系
  (3)Datanode:负责存储数据,上面我们所说的高度的容错性大部分在datanode上实现的

HDFS框架图:

2016-10-22_171649.png
主从结构:
       主节点,只有一个  : namenode
       从节点,有很多个  :datanodes

namenode负责:
      · 接收用户请求操作
      · 维护文件信息系统的目录结构
      · 管理文件与block之间的关系,block与datanade之间的关系
        注意:namenode归根结底要放在磁盘上的以保证数据的持久性,但是为了提高效率,一般在hadoop运行时时放在内存中的
 datanode负责:
      · 存储文件
      ·文件被分成block存储字磁盘上
      ·为保证数据安全,文件会有多个副本

【2】为什么?

HDFS的四大优点让其成为数据存储的主流选择
  (1)高吞吐量:
          HDFS的每个block分布在不同的rack上,在用户访问时,HDFS会计算使用最近和访问量最小的服务器给用户提供。由于block在不同的rack上都有备份
,所以不再是单数据访问,所以速度和效率是非常快的。另外HDFS可以并行从服务器集群中读写,增加了文件读写的访问带宽。
  (2)高容错性:
          上面简单的介绍了一下高度容错。系统故障是不可避免的,如何做到故障之后的数据恢复和容错处理是至关重要的。HDFS通过多方面保证数据的可靠
性,多分复制并且分布到物理位置的不同服务器上,数据校验功能、后台的连续自检数据一致性功能,都为高容错提供了可能。
  (3)容量扩充:
          因为HDFS的block信息存放到namenode上,文件的block分布到datanode上,当扩充的时候,仅仅添加datanode数量,系统可以在不停止服务的情况
下做扩充,不需要人工干预。
  (4)低成本:
        可以通过普通机器组成的服务器群来分发以及处理数据。这些服务器群总计可达数千个节点。

【3】怎么做?

-help [cmd] //显示命令的帮助信息
-ls(r) <path>   //显示当前目录下所有文件
-du(s) <path>   //显示目录中所有文件大小
-count[-q] <path>   //显示目录中文件数量
-mv <src> <dst> //移动多个文件到目标目录
-cp <src> <dst> //复制多个文件到目标目录
-rm(r)      //删除文件(夹)
-put <localsrc> <dst>   //本地文件复制到hdfs
-copyFromLocal  //同put
-moveFromLocal  //从本地文件移动到hdfs
-get [-ignoreCrc] <src> <localdst>  //复制文件到本地,可以忽略crc校验
-getmerge <src> <localdst>      //将源目录中的所有文件排序合并到一个文件中
-cat <src>  //在终端显示文件内容
-text <src> //在终端显示文件内容
-copyToLocal [-ignoreCrc] <src> <localdst>  //复制到本地
-moveToLocal <src> <localdst>
-mkdir <path>   //创建文件夹
-touchz <path>  //创建一个空文件

【4】实际案例?

(4-1):查看文件
命令: hadoop fs -ls [文件路径]
实例 1:hadoop fs -ls / (普通查看)
实例 2:hadoop fs -lsr / (递归查看)

查看文件.png

(4-2):创建目录、文件
命令: hadoop fs -mkdir [文件路径]
实例 1:hadoop fs -mkdir /d1 (创建目录d1)

创建目录.png

(4-3):上传文件
命令: hadoop fs -put [linux源文件路径] [hadoop目的地文件路径]
实例 1:hadoop fs -put /root/Desktop/Demo.py /d1 (将linux桌面的Demo.py文件上传至d1目录)
注意:这里当目的地的路径目录如果不存在,则会将文件重命名至路径,具体看实例

上传.png

(4-4):下载文件
命令: hadoop fs -get [hadoop源文件路径路径] [linux下载目的地路径]
实例 1:hadoop fs -get /d1/Demo.py /root/Desktop/ (下载d1下的Demo.py文件到桌面)

下载.png

(4-5):查看文件内容
命令: hadoop fs -text [文件路径]
实例 1:hadoop fs -text /d1/Demo.py (查看d1目录下Demo.py的内容)

查看文件内容.png

(4-6):删除文件
命令: hadoop fs -rmr [文件路径]
实例 1:hadoop fs -rm /d1/Demo.py (删除文件)
实例 2:hadoop fs -rmr /d1 (递归删除文件夹)

删除.png

(4-7):帮助
命令: hadoop
命令: hadoop fs
命令: hadoop fs -help
命令: hadoop fs -ls -help

(4-8) : 整理

1.对hdfs的操作方式:hadoop fs xxx
  hadoop fs -ls  /  查看hdfs的根目录下的内容的
  hadoop fs -lsr /  递归查看hdfs的根目录下的内容的
  hadoop fs -mkdir /d1  在hdfs上创建文件夹d1
  hadoop fs -put <linux source> <hdfs destination> 把数据从linux上传到hdfs的特定路径中
  hadoop fs -get <hdfs source> <linux destination> 把数据从hdfs下载到linux的特定路径下
  hadoop fs -text <hdfs文件>  查看hdfs中的文件
  hadoop fs -rm     删除hdfs中文件
  hadoop fs -rmr    删除hdfs中的文件夹

  hadoop fs -ls hdfs://hadoop0:9000/
等同于
  hadoop fs -ls /

【注意:****】.HDFS的datanode在存储数据时,如果原始文件大小>64MB,按照64MB大小切分;如果<64MB,只有一个block,占用磁盘空间是源文件实际大小。

【命令集】

2017-01-02_163927.png
2017-01-02_163945.png
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,544评论 6 501
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,430评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,764评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,193评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,216评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,182评论 1 299
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,063评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,917评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,329评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,543评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,722评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,425评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,019评论 3 326
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,671评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,825评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,729评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,614评论 2 353

推荐阅读更多精彩内容

  • 首先,我们在使用前先看看HDFS是什麽?这将有助于我们是以后的运维使用和故障排除思路的获得。 HDFS采用mast...
    W_Bousquet阅读 4,194评论 0 2
  • 当数据量增大到超出了单个物理计算机存储容量时,有必要把它分开存储在多个不同的计算机中。那些管理存储在多个网络互连的...
    单行线的旋律阅读 1,918评论 0 7
  • 命令基本格式:hadoop fs -cmd < args > 1.lshadoop fs -ls / 列出hdfs...
    金色木叶枫阅读 1,983评论 0 5
  • 现在的我,像野草一样,一个人在这座城市漂泊 无依无靠,孤苦伶仃 现在的我,没有朋友,没有对象 现在的我,对生活迷茫...
    南宫韶华阅读 176评论 0 1
  • 正月十六福民广场舞开始啦,听到音乐的我心情莫名的舒适,哈哈。 广场上依然保留着元宵佳节挂着的红灯笼,在灯光的照...
    凤珠阅读 124评论 0 1