240 发简信
IP属地:河南
  • 极客时间 21+22 | 哈希算法

    https://time.geekbang.org/column/article/67388 hash = 哈希 > 散列 哈希算法 将任意长度的二进制值串映射为固定长度的二...

  • 120
    极客时间 09 | Yarn资源调度框架

    从图上看,Yarn 包括两个部分:一个是资源管理器(Resource Manager),一个是节点管理器(Node Manager)。这也是 Yarn 的两种主要进程:Res...

  • 120
    极客时间 08 | MapReduce如何让数据完成一次旅行

    2个关键问题 如何为每个数据块分配一个Map,也就是代码怎么发送到数据块所在服务器,发送后如何启动,启动后如何直到数据在什么位置 处于不同服务器的map输出的<Key, Va...

  • 120
    01 一条SQL查询语句的执行过程

    【极客时间课程笔记,图非原创】 MySQL逻辑框架 server层:如图,所有跨存储引擎的功能都在这一层实现,比如存储过程、触发器、视图等 存储引擎层:负责数据的存储和提取。...

  • 120
    快速理解Spark Dataset

    1. 前言 RDD、DataFrame、Dataset是Spark三个最重要的概念,RDD和DataFrame两个概念出现的比较早,Dataset相对出现的较晚(1.6版本开...