240 发简信
IP属地:广东
  • spark 离线任务对于小文件的处理

    前言 spark 读写hive 比较多,发现总是有小文件很多,几百个几十KB的文件,这样对于后续处理很不友好,这里统一说一下。前置条件 我准备了一张50W数据的一张hive...