随着大数据和机器学习的快速发展,数据分析已成为物联网、云计算等领域最核心的处理方法,而R语言作为一种为统计计算和图形显示而设计的免费开源的语言环境,无疑是数据分析行业最炙手可热的一把“利器”!越来越多的科研人员、高校讲师、工程师等投入到R语言的学习中。
借用Google首席经济学家Hal Varian的一句话:“R最优美的地方是它能够修改很多前人编写的包的代码做各种所需要的事情,实际上你是站在巨人的肩膀上。”
一、R安装
本文采用的R语言版本为R 4.0.5。根据操作系统不同,读者可选择安装64位或32位版本,安装时直接运行R-4.0.5-win.exe。Linux、Mac OS X和Windows都有相应的编译好的二进制版本,根据所选择平台的安装说明进行安装即可。
这里以windows操作系统下安装R为例,其操作步骤如下。
(1)R官方网站是https://www.r-project.org,打开网址,界面如图所示。
(2)单击屏幕左侧“Download ”栏目下的“CRAN”按钮,跳转到R的综合资料网(Comprehensive R Archive Network,CRAN)的镜像路径选择,如图所示。
(3)在R的下载镜像路径选择“China”栏目下的任意一个镜像。
(4)单击后即可进入到R语言下载界面,并点击“Download R for Windows”,如图所示。
(5)如果是第一次安装R语言点击“base”选项,如图1-6所示。之后点击“Download R 4.0.5 for Windows”链接,即可下载相应版本的R语言,如图所示。
(6)双击下载的文件,此时会弹出一个“选择语言”对话框,如图所示,选择“中文(简体)”选项,并确定。
(7)根据按照向导提示,将R语言下载在除C盘外的其他磁盘中,并点击“下一步”按钮,如图所示。
(8)选择安装组件(默认),单击“下一步”。
(9)选择默认启动选项,单击“下一步”。
(10)选择开始菜单文件夹,单击“下一步”。
(11)选择附加任务,按照下图勾选相应选项,并单击“下一步”。
(12)安装完成,单击“结束”。
(13)桌面会出现一个蓝色的R语言图标,双击桌面快捷方式启动R语言,打开的界面如图所示。
二、RStudio安装
R语言初始编译窗口较为简略,虽然提供了文本编译器,但是无法实现代码高亮、自动纠错、快捷命令等实用功能。所以为了提高用户的R语言使用体验,以及提高代码编写效率,大多数用户会选择额外安装一个IDE(集成开发环境),以便于辅助编程。
基于此,一款专门为R定制的免费IDE——RStudio横空出世。RStudio是一个独立的开源项目,它将许多功能强大的编程工具集成到一个直观、易于学习的界面中。并且RStudio可以在所有主要平台(Windows、Mac、Linux)上运行,也可以通过web浏览器(使用服务器安装)运行。
相较于R语言,RStudio具有更加友好的页面以及更强的操作性,完全弥补了R Console的许多不足,便于对代码编写、修改与找错;便于利用R社区里提供的各种程序包;便于数据可视化,并且画图更加精美!
(1)RStudio的官方网址为https://www.rstudio.com/,打开该网址,界面如图所示。
(2)鼠标移至页面上方栏目组中的“Products”,并单击图中的蓝色背景的“Rstudio”选项。
(3)单击RStudio桌面版的下载选项,注意到商业版以及专业版的RStudio是收费的,虽然功能更强大,但是对于刚接触R语言的用户,开源的RStudio完全能够满足编程需求,RStudio的下载页面如图所示。
(4)根据自身使用的计算机操作系统,选取并下载对应的RStudio版本,需要强调的是,在下载RStudio之前,要确保电脑里已经安装了R语言,并且版本不低于3.0.1,如图所示。
(5)选择安装目录时,要将RStudio安装在R的目录里,以免发生RStudio无法关联到R的问题。
(6)安装完毕,桌面会出现一个宝蓝色的RStudio图标,双击进入RStudio的编辑窗口。
后记
RStudio编辑窗口
RStudio的编辑窗口主要有四个独立的面板,分别为脚本编辑窗口、环境管理窗口、代码运行窗口以及资源管理窗口,并且这四个部分的大小比例可以通过拖动鼠标来改变。
菜单栏的功能从左到右依次是File(文件)、Edit(编辑)、Code(编码)、View(视图)、Plots(绘图)、Session(会话)、Build(搭建)、Debug(调试)、Profile(项目)、Tools(工具)及Help(帮助)。以下介绍使用最频繁的菜单栏中的功能。
(1)File(文件)菜单主要提供了R脚本及工程的创建、打开、转编码与保存功能。并且可以通过该菜单,导入数据(Excel、SAS、SPSS等)。
(2)Edit(编辑)菜单主要提供了代码的复制、粘贴功能,还包括查找代码、代码字符替换、清除运行窗口的历史记录等功能。
(3)Code(编码)菜单包含代码块创建、多行注释与取消注释、转换函数、运行等功能。
(4)Tools(工具)菜单提供了数据集的导入、程序包的安装与升级、DOS形式的R命令行页面、内置R语言版本设置、默认工作路径设置、页面布局、RStudio与代码外观设置等全局设置。
脚本编辑窗口是R语言脚本文件的编辑区域。在区域上方提供了代码保存、运行光标所在行或选定区域的代码、运行所有脚本等功能。
环境管理窗口可以查看代码运行产生的工作变量、代码的运行记录及RStudio的相关连接。
代码运行窗口与R初始页面类似,主窗口上方的文字是刚运行R时出现的一些说明和指引,包括对所使用的R语言版本的介绍、版权声明等,文字下方的“>”符号是R语言的命令提示符,可以在后面输入命令。
资源管理窗口中的Files子窗口提供了对项目中的内容进行文件夹的创建、删除、重命名、复制、移动等操作。Plots子窗口提供了R绘图的图片浏览、放大、导出与清理功能。Packages子窗口提供了R程序包的安装、加载、更新等操作功能。Help子窗口提供了函数的帮助文档的查找与展示功能。
在知晓上述功能区的主要作用后,如果要编写R语言代码,则可以通过以下提供的两种途径运行。
① 在左下角的代码运行窗口输入代码并回车运行。
② 在脚本编辑窗口新建R脚本(快捷键Ctrl+Shift+N),并在该脚本里编写代码。写好代码后。单击“Run”按钮运行代码(全部运行)。若想运行部分代码,则需要用鼠标先选定所运行的代码,再单击“Run”按钮。
大多数R语言工作者都会采用方式②来编写代码,虽然通过方式①也可以写代码,也能显示程序运行过程和结果,但是编写的代码无法保存,并且不小心写错了一部分或者想改变工作变量,很多代码则需要重来。
RStudio常用快捷键
除了上述提到的新建脚本(Ctrl+Shift+N)快捷键外,还有其他的常用快捷键,掌握了他们可以在一定程度上提高编程效率。
(1)Ctrl+R:代替“Run”按钮,执行选中的多行或者光标所在单行代码;
(2)Ctrl+O:打开文件选择器;
(3)Ctrl+L:清除R代码运行窗口的屏幕内容;
(4)Ctrl+W:关闭当前脚本文件;
(5)Ctrl+1:光标移至脚本编辑窗口;
(6)Ctrl+2:光标移至代码运行窗口;
(7)Ctrl+Shift+C:将选择的代码行进行批量注释。