5.1 问题
- 默认Hive中创建有中文注释的表时,无论是在Hive CLI还是Hue中该注释显示都会是乱码。如使用以下建表语句:
create external table test_table
(
s1 string comment 'abc',
s2 string comment '你好啊'
)
row format delimited fields terminated by '#'
stored as textfile location '/lilei/test_table';
-
在Hive CLI中查看如下:
- 在Hue中显示也会一样乱码。
5.2 解决
-
这个问题是因为mysql中的元数据库表COLUMNS_V2中的字段COMMENT编码问题导致的,需要设置为utf-8,如下所示:
- 在mysql中设置该字段的编码为utf-8,如下所示:
mysql –u root –p
use metastore;
alter table COLUMNS_V2 modify column COMMENT varchar(256) character set utf8;FLUSH PRIVILEGES;
- 注意Hive元数据这个数据库应使用utf-8创建
- 如:create database metastore defaultcharacter set utf8;
- 回到Hive中重现create一张表,查看该表的注释,中文注释会显示正常。
- 查看以前的表
- 发现依旧显示为乱码。
- 需要修改以前的表的comment才能显示正常,在Hive CLI中执行,命令如下:
ALTER TABLE test_table1 change column s2 s2 STRING COMMENT '我很好';
大数据视频推荐:
腾讯课堂
CSDN
大数据语音推荐:
企业级大数据技术应用
大数据机器学习案例之推荐系统
自然语言处理
大数据基础
人工智能:深度学习入门到精通