一、Hive缺陷
Hive建立在Hadoop平台上,依赖底层的MapReduce和HDFS,因此延迟高
二、Impala简介
Impala由Cloudera公司开发实时交互查询系统,参照Dremel系统设计。运行需要要依赖Hive的元数据。
Impala不需要把SQL转换为MapReduce任务(是批处理,Hive需要),而是采用了分布式查询引擎(与商业并行关系数据库类似),可以之间与HDFS和HBase做交互查询,因此响应比Hive快得多,实时交互性更好。
Impala和hive采用相同的SQL语法、ODBC驱动程序和用户访问接口。