使用importtsv导入CSV数据到HBase

CSV数据如下:

id first_name last_name
1 shen teng
2 ma dongmei

创建HBase表

  1. 登录到服务器

ssh root@xxx.xxx.xxx.xxx

  1. 切换到hbase用户

root> su - hbase

  1. 进入到Hbase Shell

hbase> hbase shell

  1. 创建表

hbase(main):001:0> create 'test_hbase', 'temp'

  1. 确认表是否创建成功

hbase(main):001.0> list

执行exit退出Hbase Shell

加载数据

放CSV数据到HDFS上

  1. 首先通过scp命令上传到集群上

snow>scp hbase.csv root@xxx.xxx.xxx.xxx:/home/hbase

  1. 放CSV数据到HDFS上

hbase> hdfs dfs -copyFromLocal hbase.csv /tmp

  1. 执行impporttsv命令加载数据到hbase表中

hbase> hbase org.apache.hadoop.hbase.mapreduce.ImportTsv -Dimporttsv.separator=, -Dimporttsv.columns="HBASE_ROW_KEY,temp.first_name,temp.last_name" test_hbase /tmp/hbase.csv

  1. 确认数据是否加载成功

hbase(main):001:0> scan 'test_hbase'


注意:

  • Importtsv命令会产生大量的日志,确保有足够的空间在/var/logs目录下,最好能够挂载到单个的目录下。
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 入门指南 1. 简介 Quickstart会让你启动和运行一个单节点单机HBase。 2. 快速启动 – 单点HB...
    和心数据阅读 10,306评论 1 41
  • 将各种类型的数据库或者文件导入到HBase,常见有三种方法: (1)使用HBase的API中的Put方法 (2...
    Tim在路上阅读 14,229评论 0 2
  • 简介 HBase是高可靠性,高性能,面向列,可伸缩的分布式存储系统,利用HBase技术可在廉价PC Serve...
    九世的猫阅读 6,718评论 1 6
  • 前言 在本节中,你将首先学习单节点、独立的HBase的设置,并且学会运行单节点、独立的HBase实例! 在一个独立...
    步闲阅读 5,884评论 1 3
  • 你单身时候什么都做不了 你把困难列表 把笔一撂 翘起脚 眯眼睡觉 梦醒了 困难还是那困难 如山 所以你继续单身 你...
    jomo17阅读 1,283评论 0 0

友情链接更多精彩内容