240 发简信
IP属地:山西
  • 240
    spark杂记

    spark运行框架 提交一个spark应用时候会对应生成一个driver进程 注册spark任务到cluster manager 申请需要的资源 cluster manage...

  • hive语句大全

    hive数据库是hdfs上的文件夹,表也是文件夹,表里的数据是文件hive建表create table t_student(id string,name string,age...

  • 240
    黑苹果10.15.0安装

    下载镜像 可以在黑果小兵平台,远景论坛等平台了解黑苹果相关。首先下载macOS镜像和相关黑苹果镜像制作,百度链接地址如下链接:https://pan.baidu.com/s/...

  • hive数据倾斜原因解决方法

    Hive倾斜之group by聚合倾斜 原因: 分组的维度过少,每个维度的值过多,导致处理某值的reduce耗时很久; 对一些类型统计的时候某种类型的数据量特别多,其他的数据...

  • 240
    Hbase原理

    系统架构图 从HBase的架构图上可以看出,HBase中的组件包括Client、Zookeeper、HMaster、HRegionServer、HRegion、Store、M...

  • spark参数

    Driver spark.driver.cores driver端分配的核数,默认为1,thriftserver是启动thriftserver服务的机器,资源充足的话可以尽量...

  • 240
    RDD与算子

    什么是RDD RDD(Resilient Distributed Dataset)叫做弹性分布式数据集,是Spark中最基本的数据抽象,它代表一个不可变、可分区、里面的元素可...

  • 240
    spark运行流程

    spark中基本概念 Application:表示你的应用程序 Driver:表示main()函数,创建SparkContext。由SparkContext负责与Cluste...

  • 240
    Chrome扩展程序

    1.准备应用https://share.weiyun.com/5beYAw4密码:nFO82.将下载的zip解压,在浏览器中找到更多工具,扩展程序