240 发简信
IP属地:江苏
  • Hive数据倾斜解决方法总结

    数据倾斜是进行大数据计算时最经常遇到的问题之一。当我们在执行HiveQL或者运行MapReduce作业时候,如果遇到一直卡在map100%,r...

  • hadoop—MapReduce详解

    首先让我们来重温一下 hadoop 的四大组件: HDFS:分布式存储系统 MapReduce:分布式计算系统 YARN:hadoop 的资源调...

  • 大数据改变了世界,spark改变了大数据!

    大数据改变了世界,spark改变了大数据! Spark是一个快速的、通用的处理大数据的引擎。 Spark以内存运行时,速度比hadoop的map...