240 发简信
IP属地:台湾
  • Resize,w 360,h 240
    ROC和AUC介绍以及如何计算AUC

    1. 首先介绍下一些参数指标 精确率(Precision):Precision 真阳性率(True Positive Rate,TPR),灵敏度...

  • 背包问题

    背包问题 在n个物品中挑选若干物品装入背包,最多能装多满?假设背包的大小为m,每个物品的大小为A[i]样例如果有4个物品[2, 3, 5, 7]...

  • Resize,w 360,h 240
    Spark性能优化-数据倾斜调优

    Spark性能优化分为四个方面: 1、开发调优2、资源调优3、数据倾斜调优4、shuffle调优 数据倾斜调优 1. 使用Hive ETL预处理...

  • Spark性能优化-资源调优

    Spark性能优化分为四个方面: 1、开发调优2、资源调优3、数据倾斜调优4、shuffle调优 资源调优 num-executors参数说明:...

  • Resize,w 360,h 240
    Spark性能优化-开发调优

    Spark性能优化分为四个方面: 1、开发调优2、资源调优3、数据倾斜调优4、shuffle调优 1. 开发调优 1.1 避免创建重复的RDD对...

  • Resize,w 360,h 240
    理解RDD、DataFrame、Dataset区别

    先上图 rdd 优点1.强大,内置很多函数操作,group,map,filter等,方便处理结构化或非结构化数据2.面向对象编程,直接存储的ja...

  • Resize,w 360,h 240
    关于SparkSQL中withColumn生成自增序列的一个坑

    多个分区情况下 首先我们创建一个RDD并设置分区数为2,然后转换成DataFrame,生成一列新的ID 然后我们看下生成的ID,可见同分区连续 ...

  • Resize,w 360,h 240
    Spark任务提交流程

    1. Spark运行原理 (1)sparkContext向资源管理器注册并申请资源(2)资源管理器根据预先设定的算法,在资源池里分配合适的Exe...

  • GoogLeNet

    GoogLeNet 前言 Inception V1(也称为GoogLeNet,命名致敬Google和LeNet),是2014年由Christia...