IP属地:四川
SortShuffleManager两种运行机制 SortShuffleManager的运行机制主要分成两种,一种是普通运行机制,另一种是byp...
实时任务监控原因 在实时任务执行的过程中,由于数据突然激增或网络阻塞等情况,使得任务数据堆积或失败等 解决办法 通过实现SparkListene...
问题 在spark-sql中使用此种 partition BETWEEN 'start' AND 'end' OR (partition = '...
问题描述 在开发过程中使用spark去读取hive分区表的过程中(或者使用hive on spark、nodepad开发工具),部分开发人员未注...
在使用Spark-sql开发过程中有时候没有注意数据类型,导致程序本身进行数据类型推导,使得任务执行能正常执行(无报错信息)但程序无数据输出...