1、什么是hadoop?
开源的分布式存储和分布式计算平台
ApacheHadoop软件库是一个框架,允许使用简单的编程模型在计算机集群中对
大型数据集进行分布式处理。他被设计成从单一服务器扩展到数千台机器。每台
机器都提供本地计算和存储。该库本身不是依靠硬件来提供高可用性,而是用于
检测额和处理应用层的故障,因此在一组计算机上提供高可用的服务,而每台计
算机都可能容易出现故障
2、Hadoop能做什么?
搭建大型数据仓库
PB级护具的存储、处理、分析、统计等业务
搜索引擎、日志分析、数据挖掘、商业智能
大数据基础入门知识 2019-07-25
©著作权归作者所有,转载或内容合作请联系作者
- 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
- 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
- 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
推荐阅读更多精彩内容
- //一共81个,开源大数据处理工具汇总(上) | 36大数据http://www.36dsj.com/archiv...