hive动态分区等脚本

最近终于有点时间了,不容易啊, 下次给大家分享点Azkaban怎么调度,脚本里面定制化参数,整个数据的流入,流出,到数据的展示一整套架构, hive的维度建模,设计原理, 包括flink,kylin等, Mllib!!

//将数据按data_date分区动态插入到kpi_company_perform_rate_day表中

set hive.exec.dynamic.partition.mode=nonstrict;

set hive.exec.dynamic.partition=true;

SET hive.exec.max.dynamic.partitions=100000;

SET hive.exec.max.dynamic.partitions.pernode=100000;

insert overwrite table dm.kpi_company_perform_rate_day partition(etl_tx_dt)

SELECT

data_date

,kpi_name

,goal_value

,reach_value

,reach_rate

,from_unixtime(unix_timestamp(), 'yyyy-MM-dd HH:mm:ss')

,cast(regexp_replace(data_date,'-','') as int )  etl_tx_dt

  FROM test.test_kpi_company_perform_rate_day


//查询数据库中所有为null的表

USE information_schema;

SELECT table_schema,table_name,table_rows FROM TABLES WHERE table_rows = 0 ORDER BY table_name ;




;

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容