Hive 中 null 和\N 的处理

Hive中有种假的NULL,它看起来和NULL一摸一样,但是实际却不是NULL。空值NULL在底层默认是用'\N'来存储的,而我们习惯性对NULL 值的过滤,一般是is null 和 is not null。所以此时可以通过对修改hive 表的信息,来保证控制都显示为指定值 ,方便进行过滤。解决方法如下:

(1)如下:

alter table   t_dw_ct_author    set serdeproperties ('serialization.null.format' = 'NULL');

则出现:底层数据保存的是'NULL',通过查询显示的是'NULL'

这时如果查询为空值的字段可通过 语句:a is null 或者 a='NULL'

或者

alter table t_dw_ct_author set serdeproperties('serialization.null.format' = '\N');

则出现:底层数据保存的是'\N',通过查询显示的是'NULL'

这时如果查询为空值的字段可通过 语句:a is null 或者 a='\\N'

(2)'' 与 length(xx)=0

'' 表示的是字段不为null且为空字符串,此时用 a is null 是无法查询这种值的,必须通过 a=''  或者 length(a)=0 查询

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

友情链接更多精彩内容