hadoop基础知识

hdfs的块大小默认为129m

大数据甚于好算法
副本可以避免数据丢失
mapreduce是一个批处理系统，而不适合于交互式系统
与hadoop协同工作的处理模式
交互式sql ---》hive
迭代式计算 ---> 机器学习
流处理 ----》存储地址
搜索 ---》

image.png

每个reduce操作都又一个输出文件
hadoop对数据进行合理的切片，默认是128MB
map任务的输出为本地磁盘，而不是hdfs

image.png

最后编辑于：2018.12.13 15:50:11

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

关于Mongodb的全面总结
关于Mongodb的全面总结 MongoDB的内部构造《MongoDB The Definitive Guide》...
中v中阅读 32,122评论 2赞 89
117道有关大数据面试题解析，希望对你有所帮助
一.简述如何安装配置apache 的一个开源的hadoop 1.使用root账户登陆 2.修改ip 3.修改hos...
栀子花_ef39阅读 10,384评论 0赞 52

Hadoop 基础知识
简介大数据是一个概念也是一门技术其技术指在以hadoop为代表的平台框架上进行数据分析的技术。包括实时数据处理、...
edwin1993阅读 4,187评论 0赞 2
Hadoop 简明教程
目的这篇教程从用户的角度出发，全面地介绍了Hadoop Map/Reduce框架的各个方面。先决条件请先确认Had...
SeanC52111阅读 5,693评论 0赞 1
2018.09.14开心工作日志
今天给自己定的目标是20个，完成目标了。明天给自己定的目标是21个。今天运用了婧婷的佛系发单要微信法，完成任务了...
开心Ruby阅读 1,014评论 0赞 1

1赞2赞

赞赏

手机看全文