HDFS

map和reduce可以用自己编程

hdfs存储的是大量文本信息，适合做商业数据挖掘，既然是挖掘就在于要多次读，而不是一次次读写。因为写入成本高，每个文件要有三个副本
因此就导致了数据的高度容冗余

1版本是64M
2版本是128M。默认是存储3个副本，因此存储的总容量是*3

最后编辑于：2017.12.08 23:50:25

Hadoop HDFS和MapReduce
先思考问题我们处在一个大数据的时代已经是不争的事实，这主要表现在数据源多且大，如互联网数据，人们也认识到数据里往...
墙角儿的花阅读 7,458评论 0赞 9
Hadoop学习笔记（二）HDFS
HDFS的设计目标通过上一篇文章的介绍我们已经了解到HDFS到底是怎样的东西，以及它是怎样通过多副本机制来提供高...
陌上疏影凉阅读 1,486评论 0赞 3
你忙归忙，什么时候有空娶我？
晚上十一点的时候，手机铃声意外地响起，电话那头的当当轻声地啜泣，继而有些失声地痛哭。小鸭怎么办？我感觉他不爱我了。...
春里小鸭阅读 1,962评论 17赞 16
想要遇见更好的自己
我是一名某三流大学的学生，偶然间下载了简书这个App 。发现了打开了新的世界。我想在世界上，会有很多人跟我一样，...
抓住微光的女子阅读 228评论 1赞 1
自律五步走，问题变快乐——真自由预习课有感
迅雷不及掩耳盗铃组勤勤我因为自身能力的原因，每次听老...
勤勤子衿阅读 393评论 0赞 1

赞1赞

赞赏

手机看全文