
IP属地:湖南
spark简介 spark生态 spark架构
9.3 YARN
分布式并行编程是为了解决数据产生速率与CPU处理速率失衡的问题 MapReduce模型介绍 7.3 工作流程 7.4 shuffle过程 7.5...
8.1 8.2 hive简介 8.3 hive到MapReduce 8.4 impala 8.4.3 8.5
兴起的原因:RDBMS无法满足web2.0的需求 、数据模型的局限性、Web2.0 RDBMS 许多特性没有发挥 RDBMS:无法满足海量数据、...
前身:BigTable 网页搜索: google分布式存储系统BigTable依赖GFS Hbase(bigtable的开源实现): 高可靠、高...