一、开始使用多线程 Thread类由threading模块提供,通过实例化Thread类可以创建线程,其构造函数如下: 其中关于参数的解释如下: group,保留参数,暂时没...

一、开始使用多线程 Thread类由threading模块提供,通过实例化Thread类可以创建线程,其构造函数如下: 其中关于参数的解释如下: group,保留参数,暂时没...
一、装饰器的定义 装饰器,顾名思义,就是起到装饰的作用,即在不改变已有函数代码及其调用方式的前提下,对已有函数进行功能扩展,实现了低侵入性、高内聚低耦合的目标。 二、装饰器使...
一、RDD介绍 1.1 什么是RDD RDD(Resilient Distributed DataSet),称作弹性分布式数据集,是Spark中最基本的数据抽象,表示一个不可...
一、PySpark是什么 Python PySpark是Spark官方提供的一个Python类库,其中内置了完全的Spark API,使得Python用户在导入这个类库后,可...
一、Marp是什么 Marp是一个轻量的框架,可以将MarkDown编写的文档转换为PPT,从而解放开发者制作PPT的繁琐过程,只要专注于内容的编写即可。 当然,Marp制作...
一、Spark是什么 Spark[https://spark.apache.org/]是Apache下的一个用于大规模数据处理的统一分析引擎,Unified engine f...
一、ZK简介 在大数据技术体系内,很多技术框架都是用动物的名字命名的,比如Hadoop(大象)、Hive(蜜蜂)、Pig(小猪)。大数据服务通常都是分布式的,多个节点之间角色...
一、DataX Web是什么 DataX web是在DataX的基础上开发的分布式的数据同步工具,方便DataX的用户在网页上通过点击和配置就能完成DataX任务的配置和执行...
一、DataX是什么 DataX[https://github.com/alibaba/DataX]是阿里巴巴开源的离线数据同步工具,实现了包括主流RDBMS数据库、NoSQ...