240 发简信
IP属地:北京
  • hadoop分布式文件存储系统hdfs

    hdfs是为高数据吞吐量运用优化的,这个就可能会以提高延迟为代价要善于利用分而治之的思想,例如hdfs中的块,不过也需要额外的管理程序namenode管理着文件系统的命名空间...

  • 240
    hadoop基础知识

    hdfs的块大小默认为129m map操作的输出写入本地磁盘,而不是hdfs文件,reduce的输出是在hdfs文件 分布式文件系统 大数据甚于好算法副本可以避免数据丢失ma...