1.sqoop是什么?
主要用于在Hadoop与RDBMS间进行数据的传递
2.sqoop分为哪两个分支,各最新版本是什么?
sqoop1:1.4.7
sqoop2:1.99.7
3.在工作中我们用的最多的是sqoop1,那么导入和导出,谁给谁的
导入是RDBMS到Hadoop
导出是Hadoop到RDBMS
4.假如输入一个命令找不到not found,你们觉得该怎么办?(老生常谈)
先看打错了没有,再看PATH有没有,或者yum安装
5.sqoop命令参数-m是什么意思
指定MapReduce的数量
6.sqoop 想要把MySQL数据导到hive里,那么是不是要加mysql jdbc jar包?
需要
7.sqoop导入,我能不能直接写SQL的导?
可以 --query指定
8.sqoop会有reduce job吗
不会
9.假如让你们项目作业的sqoop 每天导数据到hive分区表里,用shell脚本和crontab,有没有信心完成?
还要练习