Hive安装

1.Mysql配置

service mysqld start
mysql -uroot
create user 'hive' identified by 'hive';
create database tpin;
grant all privileges on *.* to  'hive'@'localhost' identified by 'hive';
grant all privileges on tpin.* to  'hive'@'%' identified by 'hive';
grant all privileges on tpin.* to  'hive'@'cloud-03' identified by 'hive';
flush privileges;
mysql -uhive -p

2.Hive配置:修改hive-site.xml文件

:%s#${system:java.io.tmpdir}/${system:user.name}#/opt/hive/tmp/hive#g
:%s#${system:java.io.tmpdir}#/opt/hive/tmp/hive#g

将javax.jdo.option.ConnectionURL设置为

jdbc:mysql://cloud-03:3306/tpin

将javax.jdo.option.ConnectionPassword设置为

hive

将javax.jdo.option.ConnectionUserName设置为

hive

将javax.jdo.option.ConnectionDriverName设置为

com.mysql.jdbc.Driver

3.Hive建表

CREATE TABLE nsr_tzf(zjhm string,nsrdzdah string,tzbl double,tzje double,tzfxz_id int) ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.OpenCSVSerde'WITH SERDEPROPERTIES ("separatorChar" = ",", "quoteChar"     = "\\"", "escapeChar"    = "\\\\") STORED AS TEXTFILE;

CREATE TABLE tpin_vertex_wwd(
id BIGINT,
type INT,
sbh STRING,
ishuman Boolean,
community_id BIGINT
);

4.载入csv文件

LOAD DATA LOCAL INPATH '/root/tpinDataCsv/nsr_tzf.csv' INTO TABLE nsr_tzf;

5.导出文本文件

INSERT OVERWRITE LOCAL DIRECTORY 'tpinDataCsv/tpin_vertex_wwd' SELECT * FROM tpin_vertex_wwd;

6.导入文本文件

LOAD DATA LOCAL INPATH 'tpinDataHive/tpin_vertex_wwd/00000*_0' INTO TABLE tpin_vertex_wwd;

7、sqoop导出到Oracle

sqoop export --connect jdbc:oracle:thin:@202.117.16.188:1521:tpin --username myTpin --password myTpin --table TPIN_VERTEX_WWD --export-dir /user/hive/warehouse/tpin_vertex_wwd --input-fields-terminated-by '\\001' --input-null-string '\\\\N' --input-null-non-string '\\\\N'

8.从sqoop Oracle导入hive表(hive表不必事先建)

sqoop import --hive-import --connect jdbc:oracle:thin:@202.117.16.188:1521:tpin --username myTpin --password myTpin --verbose --hive-database default --m 1 --table TPIN_2015_FP

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • HIVE是一个基于Hadoop的数据仓库,适用于一些高延迟性的应用。如果对延迟性要求比较高,则可以选择Hbase。...
    夏无忧阳阅读 5,105评论 0 12
  • 三种模式• 内嵌模式:元数据保持在内嵌的derby模式,只允许一个会话连接• 本地独立模式:在本地安装My...
    李蕊江阅读 747评论 0 0
  • 今天安装hive,按着官方文档操作,但是并没有能够成功,把碰到的问题记录下 1)执行$HIVE_HOME/bin/...
    牛逼的二进制阅读 6,697评论 0 1
  • 1、运行环境 主机IP 主机名 2、配置主机名(分别在五台机器上执行) hostname +主机名例如: h...
    献给记性不好的自己阅读 3,596评论 0 6
  • 一、在装hive之前须确保已经装了JDK和hadoop二、上传hive安装包、解压 三、配置环境变量 四、把mys...
    人活一世阅读 451评论 0 2