240 发简信
IP属地:湖北
  • Spark2x on yarn日志配置详解

    概述 Spark on Yarn的日志配置分为两类: Spark on Yarn client模式 Spark on Yarn cluster模式 接下为大家逐一介绍。 Sp...

  • 120
    第三章 Yarn应用设计

    概述 Yarn是一个资源的管理系统,负责集群的管理及调度。如果想要一个应用运行在Yarn,需要编写两个组件: Client(客户端)客户端负责项目ResourceManage...

  • 120
    第二章 Yarn基础库

    简介 与MRv1相比Yarn的设计要复杂得多。YARN借用了MRv1的一些底层基础库(如RPC库),又引入了很多新的设计方式,它的基础库更多,如:google的开源序列化框架...

  • 120
    第一章 Yarn简介

    简介 Yarn是Hadoop生态圈中的一个通用资源管理系统和调度平台,产生于Hadoop2。可为上层应用提供统一的资源管理和调度,它的引入为集群在利用率、资源统一管理和数据共...

  • Docker容器通过宿主机安装JDK和MAVEN

    1,下载jdk和maven JDK http://www.oracle.com/technetwork/java/javase/downloads/jdk8-download...

  • Sqoop的使用

    1,什么是Sqoop sqoop是apache旗下一款“Hadoop和关系数据库服务器之间传送数据”的工具。导入数据:可以从MySQL,Oracle等关系数据库中导入数据到H...

  • 120
    Hive的安装

    1 前期准备 1,需要搭建HDFS2,需要搭建MapReduce3,安装mysql( 其它数据库都可以),如果不是很清楚安装mysql,请查看 http://www.li...

  • Hadoop HA部署详解

    1,前期准备 1 修改Linux主机名2 修改IP3 修改主机名和IP的映射关系 /etc/hosts4 关闭防火墙5 ssh免登陆6 安装JDK,配置环境变量等 2,集群规...

  • 120
    Mapreduce的经典排序(快排 & 归并)

    1,快速排序 基本思想:选择一个基准元素,通常选择第一个元素或者最后一个元素,通过一趟扫描,将待排序列分成两部分,一部分比基准元素小,一部分大于等于基准元素,此时基准元素在其...

  • 120
    Java NIO(1) 概述

    什么是JavaNIO NIO全名(NewInput/ Output),在java1.4中引入。NIO是一种同步非阻塞的IO模型。同步是指线程不断轮询IO事件是否就绪,非阻...

  • 第一章 Solr安装

    本文是基于solr6.4和tomcat8.5进行单机环境的安装。 1,准备工作: 下载Solr-6.6.0 http://www.apache.org/dyn/clos...