有时候会遇到json格式的数据,一般这些数据分为两种
第一种,解析完成后,直接得到了你想要的数值或类型,这一类就可以直接用数据了。
第二种,解析完成后,数据被封装在一起,用parse_json_object函数(解析json的函数,可能每个公司用的不一样)没办法进一步解析,那么这时候数据就没办法用了。
针对第二种情况总结的方法,放在这里
首先看看几个函数的用法:
regexp_replace
语法规则:
regexp_replace(1,2,3)
一般用3个参数,有的时候可以用6个参数
第1个是输入的字符串
第2个是正则表达式
第3个是替换的字符
split
语法规则:
split(1,2)
一般用2个参数
第1个是输入的字符串
第2个是定位的字符
根据第二个字符将整个字符串切开,
比如这个
split({"水果":"0.09","发面主食":"0.16","肉类":"20.01","快餐":"0.09","营养品":"0.09"},",")
就是根据「,」将整个字符串切开
lateral view explode( ) adtable
含义:行转列
括号中放入需要转成列的字段
下面是一个实例,看完后就应该都能理解了
例子:
解析到最后一步后,得到如下内容
{"水果":"0.09","发面主食":"0.16","肉类":"20.01","快餐":"0.09","营养品":"0.09"}
最后我们希望得到这个结果:
按步骤演示代码和结果:
第一步:
用正则表达式去掉「{}」一对大括号
代码:
select regexp_replace(regexp_replace('{"水果":"0.09","发面主食":"0.16","肉类":"20.01","快餐":"0.09","营养品":"0.09"}','[\{|\}|\"|\"]',''),' ','')
运行结果:
第二步,
用split函数切开,用lateral view explode( ) adtable 将行转成列
代码:
select
split(regexp_replace(regexp_replace('{"水果":"0.09","发面主食":"0.16","肉类":"20.01","快餐":"0.09","营养品":"0.09"}','[\{|\}|\"|\"]',''),' ','')
,",") category_prefers
) t lateral view explode(t.category_prefers) adtable as category_prefers_1
运行结果:
第三步,
再用2次split函数将类型和数据分离
代码:
select split(category_prefers_1,":") [0] as name,split(category_prefers_1,":") [1] as point
from
(select
category_prefers_1
from
(select
split(regexp_replace(regexp_replace('{"水果":"0.09","发面主食":"0.16","肉类":"20.01","快餐":"0.09","营养品":"0.09"}','[\{|\}|\"|\"]',''),' ','')
,",") category_prefers
) t lateral view explode(t.category_prefers) adtable as category_prefers_1
) t
运行结果:
话说有没有更简单的办法,这种搞法实在太复杂了,如果有更简单的方法,欢迎留言,🙏