240 发简信
IP属地:四川
  • Spark Shuffler之SortShuffleManager实现及3种ShuffleWrite策略选择与源码分析

    前序 在Spark的历史版本中,对于Shuffle Manager有两种实现。在1.2版本之前的Hash Base Shuffler,以及从1....

  • 比pgload更快更方便写入大数据量至Greenplum的Greenplum-Spark Connector

    前序 Greenplum是目前比较优秀的mpp数据库,其官方推荐了几种将外部数据写入Greenplum方式,包含:通用的Jdbc,pgcopy和...