18.1 问题显现与分析
- Hive表中存储的Timestamp类型的字段显示日期与Impala中查询出来的日期不一致。
- 创建一个简单的测试表
create table date_test4(
id INT,
create_date INT,
create_date_str STRING
);
- 向表中插入一条测试数据
insert into date_test4 values(1,'1503751615','2017-08-26 08:46:55');
- 获取当前系统时间存入表中。通过Hive查询时间显示:
select id,create_date_str,from_unixtime(create_date) from date_test4;
- 通过Impala查询时间显示:
select id,create_date_str,cast(create_date as timestamp) from date_test4;
- 可以看到通过Hive查询看到的时间与通过Impala查询看到的时间不一致;
- 问题分析
- Hive的from_unixtime
-
Hive官网from_unixtime函数说明:
-
- Hive的from_unixtime
- 在Hive中通过from_unixtime函数将TIMESTAMP时间戳转换成当前时区的日期格式的字符串,默认格式为“xxxx-MM-dd HH:mm:ss”,所以Hive在查询的时候能正确的将存入的时间戳转成当前时区的时间;
- Impala的TIMESTAMP
- 默认情况下,Impala不会使用本地时区存储时间戳,以避免意外的时区问题造成不必要的问题,时间戳均是使用UTC进行存储和解释。
18.2 解决方法
- 使用Impala的from_utc_timestamp函数指定时区进行时间转换,如下:
select id,create_date_str, cast(create_date as timestamp),from_utc_timestamp(cast(create_date as timestamp), 'EDT') from date_test4;
- 指定时区后时间与原始Hive中显示时间一致,时区查看如下地址:
http://zh.thetimenow.com/time-zones-abbreviations.php
大数据视频推荐:
腾讯课堂
CSDN
大数据语音推荐:
企业级大数据技术应用
大数据机器学习案例之推荐系统
自然语言处理
大数据基础
人工智能:深度学习入门到精通