一、两张表都存hive
行云作为纯计算引擎读hive的元数据和数据(限于parquet文件)来做join,速度快;
二、两张表都存hive
行云建外部表指向hive表,会把join任务下推给hive,速度慢;
三、两张表都存hive
行云建外部表指向hive数据文件(限于csv和orc文件),同1,速度快;
四、两张表一张在hive
一张在行云,行云建外部表指向hive表,会把hive表抽过来做join,速度慢;
五、两张表一张在hive
一张在行云,行云建外部表指向hive数据文件(限于csv和orc文件),会直接读hive数据和行云数据做join,速度快;