240 发简信
IP属地:北京
  • Spark SQL底层执行流程详解

    本文目录 一、Apache Spark 二、Spark SQL发展历程 三、Spark SQL底层执行原理 四、Catalyst 的两大优化 完...

  • Resize,w 360,h 240
    数仓建设保姆级教程,离线和实时一网打尽(理论+实战)

    本文大纲: 因内容较多,带目录的PDF查看是比较方便的: 数仓建设保姆级教程PDF文档[http://mp.weixin.qq.com/s?__...

  • Resize,w 360,h 240
    基于Flink的实时数仓建设

    目录: 一. 实时计算初期 二. 实时数仓建设 三. Lambda架构的实时数仓 四. Kappa架构的实时数仓 五. 流批结合的实时数仓 一、...

  • Resize,w 360,h 240
    数据仓库之数据质量建设(深度好文)

    数仓建设真正的难点不在于数仓设计,而在于后续业务发展起来,业务线变的庞大之后的数据治理,而数据治理的范围非常广,包含数据本⾝的管理、数据安全、数...

  • Resize,w 360,h 240
    写给初学者,一文搞懂大数据学习、岗位、面试及简历

    最近有读者私聊我时发现有不少应届生和初学者,他们在大数据怎么学,以及大数据怎么面试,简历怎么写等方面有很大的困扰,今天我们就来谈谈关于大数据的一...

个人介绍
公众号【五分钟学大数据】,专注于大数据研究