Hive常用函数

假设现在有一个订单表(order),里面有3个字段:uid、item_id(商品id)、price、ts(时间戳)

uid item_id price ts
u1 i1 10 1644503781
u2 i2 15 1644504880
u3 i3 20 1644503984

时间函数

将时间戳转化为可阅读的字符串

select from_unixtime(ts, 'yyyyMMdd HH:mm:ss') from order
--结果:
--20220210 22:36:21
--20220210 22:54:40
--20220210 22:39:44

将日期转化为时间戳

select unix_timestamp('20220209', 'yyyyMMdd');

计算日期差值,如过滤出距离2022.02.09 7天的订单(需要注意日期的格式)

select * from order where datediff('2022-02-09', from_unixtime(ts, 'yyyy-MM-dd')) <= 7

集合函数

计算集合大小

select size(array(1,2,3,4)); --结果: 4  

获取map中的key

select map_keys(map('a',1,'b',2,'c',3)); --结果: ["a","b","c"]

获取map中的取值

select map_keys(map('a',1,'b',2,'c',2)); --结果: [1,2,2]

判断数组中是否包含某个值

select array_contains(array(1,2,3,4), 4); --结果: true

数组排序

select sort_array(array(3,2,1,4)); --结果: [1,2,3,4]

拼接为字符串

select concat_ws('_', array('a', 'b', 'c')); --a_b_c

字符串函数

json解析

select get_json_object('{"name":"xyz"}', '$.name'); --xyz

大小写转化

select lower('xYz'); --xyz
select upper('xYz'); --XYZ

条件函数

if条件

select
    if(id is null, 0, id) as id
from
    (
        select
            1 as id
        union all
        select
            null as id
    )

case when

select
    case
        when item_id = 'i1' then 1
        else 0
    end as item_str
from
    order

填充缺失值(nvl)

select
    nvl(id, 0) as id
from
    (
        select
            1 as id
        union all
        select
            null as id
    )

取第一个不为null的值,否则为null

select coalesce(1, null); -- 1
select coalesce(null, 2); -- 2
select coalesce(null, null, 3); -- 3

杂项

数据类型转化

select cast('123' as int);

单行转多行

select explode(array(1,2,3));
--结果:
--1
--2
--3

原文链接:http://codelibrary.tech/2022/02/09/hive/

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 关系运算 1、等值比较: = 语法:A=B操作类型:所有基本类型描述: 如果表达式A与表达式B相等,则为TRUE;...
    phylicia2018阅读 452评论 0 0
  • 1、系统内置函数1.查看系统自带的函数hive> show functions;2.显示自带的函数的用法hive>...
    我还不够强阅读 889评论 0 0
  • 文章目录 1 关系运算1.1 1、等值比较: =1.2 2、不等值比较:1.3 3、小于比较:1.4 4、小于等于...
    叫我老村长阅读 886评论 0 2
  • 目录:一、关系运算二、数学运算三、逻辑运算四、复杂的数据类型 array、map、struct五、复杂类型访问操作...
    夜希辰阅读 1,356评论 1 6
  • 本篇文章长更,欢迎大家收藏和喜欢 2018.12.25 字符串函数2 1.正则表达式解析函数:regexp_ext...
    清听阅读 4,269评论 0 1