spark在1.5及其版本之后内置有sparkR,我用的服务器上安装的spark的版本为2.2,安装位置在/usr/lib/spark-current,此目录下有一个R文件夹,SparkR就装在./R/lib目录下。
每次进入R后,要想载入SparkR,需要先执行以下命令:
library(rJava)
libpath<-.libPaths() #所有R承认的R包路径,即library()的时候R会去查看的路径
libpath<-c(libpath,"/usr/lib/spark-current/R/lib") #此即为SparkR所在的目录
.libPaths(libpath)
rm(libpath)
library(SparkR) #成功载入