
IP属地:天津
1.Spark的transformation操作为什么需要序列化? Spark是分布式执行引擎,其核心抽象是弹性分布式数据集RDD,其代表了分布...
1. 2. 3.
1.查找数据到本地 insert overwrite local directory '/home/mydir/mydir' select ....
1.hive表中的基本数据类型 2,hive创建分区表 2.1内部表 建表语句: create table table_name( F...
awk sed grep expr let
1,参数调优 hive.map.aggr = true hive.groupby.skewindata =true 2,
1.,用户提交Application 2,启动Driver进程 3,注册Application 4,启动Executor 5,启动Task执行 ...