windows 系统
前言
目前有两个版本的R可以下载,第一个版本在这里r-projet,缺点是默认单核运算,速度比较慢,优点是版本更新修复bug比较快,包安装起来比较友好。第二个版本是微软提供的microsoft-r-open,优点是默认多核运算,并且使用MKL(Intel®Math KernelLibrary)加速矩阵运算,速度比较快,缺点是版本更新异常慢,包安装起来没有r-projet友好。今天,我将介绍结合这两个版本的优点,安装配置一个默认多核运算并且安装包比较有好的R。
安装前
保证用户名是英文的,如果是中文用户名,请重装系统并用英文用户名
在非系统盘位置,新建四个文件夹,比如R_soft,R_studio,R_files,R_tools
安装路径不要包含中文,R对中文支持不好
下载相关文件
直接官网下载网速非常慢,下面给出国内镜像网站地址
R:(https://mirrors.tuna.tsinghua.edu.cn/CRAN/)
Rstudio:(https://rstudio.com/products/rstudio/download/#download)
Rtools:(https://cran.r-project.org/bin/windows/Rtools/)
MKL:(https://software.intel.com/content/www/us/en/develop/tools/parallel-studio-xe/choose-download.html)
安装相关软件
一定要先安装 R 再安装 RStudio!
R:请选择英文路径,建议安装在一开始建立的R_soft文件夹里
Rstudio: 建议安装在一开始建立的R_studio文件夹里
Rtools:建议安装在一开始建立的R_tools文件夹里
MKL: 直接默认安装即可
配置Rtools
安装完以上软件后,启动安装好的Rstudio,输入以下命令并运行:
writeLines('PATH="${RTOOLS40_HOME}\\usr\\bin;${PATH}"', con = "~/.Renviron")
之后重启Rstudio,运行
Sys.which("make")
给出刚才你安装Rtools路径就表示你安装成功!!
下载常用到的包
启动Rstudio,输入以下命令,静静等待即可!
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
pkgs <- c("tidyverse","dplyr","tidyfst",
"fs","sf","mlr","mlr3",
"EDA","mice","plotly","randomForest",
"rpart","splines","mle4","ncdf4","gamma4",
"lubridate","stringr","tidyr","htmlwidgets",
"DT","gt","tidymodels","car","mgcv","survival",
"shiny","data.table","purrr","future","progress",
"tictoc","jsonlite","listviewer","skimr","devtools",
"rmarkdown","RcolorBrewer","knitr",
"Rcpp","plyr","rticles","pacman",
"beepr","laendR","drake","bayesplot",
"cowplot","hrbrthemes","janitor",
"nanirar","tidylog","validate",
"speedglm","fixest")
install.packages(pkgs,dependencies = T)
配置R
找到你刚才安装R的文件目录,进入以下目录../R_soft/R-4.0.2/etc ,用记事本打开Rprofile.site文件,并参考以下代码选择性复制粘贴到这个文件。
#请修改自己的位置,用于存放你下载的安装包,建议放在非系统盘
.CUSTOM_LIB = "E:/R_files/R_library"
#请修改自己的位置,用于存放临时数据
.TMP = "E:/R_files/R_temp"
if(!dir.exists(.CUSTOM_LIB)){
dir.create(.CUSTOM_LIB)
}
.libPaths(c(.CUSTOM_LIB, .libPaths()))
message("Using library: ", .libPaths()[1])
if(dirname(tempdir()) != .TMP){
if(!dir.exists(.TMP)) dir.create(.TMP)
cat(paste0("TMPDIR = ", .TMP), file="~/.Renviron", sep = "\n")
}
message("Using temp directory: ", .TMP)
##为xaringan 制作presentation服务
options(servr.daemon = TRUE)
##选择默认的镜像网址,加快安装包下载速度
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
# 设定字体,特别注意里面有一个 enfont 和 cnfont 是我最常用的两个字体。
windowsFonts(
en_font = windowsFont("Times New Roman"),
cn_font = windowsFont("思源宋体")
)
en_font = "en_font"
cn_font = "cn_font"
# 设定 ggplot2 绘图主题
ggplot2::theme_set(hrbrthemes::theme_ipsum(base_family = 'en_font'))
# 取消科学计数法的显示
options(scipen = 1)
# 设定 ggplot2 的默认调色板
options(
ggplot2.continuous.colour = "viridis",
ggplot2.continuous.fill = "viridis"
)
配置Rstudio
能设定元素很多,建议仔细看看!下面只是部分例子:
Tools -> Global Options -> General
Tools -> Global Options -> Code
Tools -> Global Options -> Apperance
快捷键 是提高生产力的重要要素,建议设定一组自己能习惯的快捷键
配置MKL,开启多线程运算
安装好MKL以后,找打以下文件夹:
<!-- -->
"C:\Program Files (x86)\IntelSWTools\compilers_and_libraries\windows\redist\intel64\mkl"
"C:\Program Files (x86)\IntelSWTools\compilers_and_libraries\windows\redist\intel64\compiler"
以上两个文件夹里所有的文件全部复制粘贴到以下文件夹:“...2”,也就是你安装R的文件夹!
复制好以后在该目录下找到mkl_rt.dll文件,复制到桌面,不改变文件内容,修改文件名成Rblas.dll,并放回“...2”,直接覆盖原来的文件
同理找到mkl_rt.dll文件,复制到桌面,不改变文件内容,修改文件名成Rlapack.dll,并放回“...2”,直接覆盖原来的文件
恭喜你,大功告成,感受一下MKL加速后运算速度有多快,尝试运行以下以下代码,同时你可以拿其他单核运算电脑运行下同样的代码,对比下运行速度。
m <- 10000
n <- 2000
a <- matrix(runif(m*n),m,n)
system.time(s <- svd(a,nu=0,nv=0))
## user system elapsed
## 14.42 0.58 2.06
提醒:这步配置好可以卸载MKL,以释放空间!!!
致谢
经过一段时间的学习,算是有那么一丁点入门R了,感谢在成长路上指导帮助我的每一位,首先是自己的导师王斌老师,能给与支持和鼓励,感谢薛涛老师不厌其烦的解答我的每一个细节,感谢Rstata学院的老师同学们耐心又及时解答疑惑,感谢黄天远大神及其在大神组的群里每一个大牛们的技术指导,感谢华东吴亦凡(公众号:pypi主人)用爱发电,感谢王诗翔(公众号:优雅R)分享技术,感谢送哥、霸哥、stone哥等等所有技术大哥给予的指导和帮助!!!!!!!!!!