1. 什么是R语言?
R语言是一种自由软件编程语言与操作环境,主要用于统计分析、绘图和数据挖掘。
R语言是从S语言演变而来的。
2. R语言能干什么?
• 理论上来说,其他高级编程语言能做的,R基本上也都能实现,但一般不把R当做是一门严谨的编程语言,因为其语言设计很像一门统计分析语言,其中有很多默认参数,因此具体问题时需要细心去调试。
• 实际上来说,R主要在统计学相关内容以及绘图上有相当大的优势。
▷ R语言做统计分析举例
3. R语言的入门路线
• 下载对应系统的R语言安装包并安装 (http://www.r-project.org/)
• 下载R studio
• 打开R Studio配置一个你喜欢的颜色
• 开始使用R
当你在使用R的时候,你已经在入门了!
▷ R语言学习参考书:
a. 《R For Beginners 2.0》——完全没有经验的朋友
这是一本非常薄的网络社区写作的免费的电子书,非常严谨,使得你对R语言有个基础的认识,知道R可以用来做什么。当你把这本书里所有的代码敲过一遍之后,你就相当于已经入门R语言了。
b. 《统计建模与R软件》——对于有点R经验想学统计的朋友 (清华大学出版社)
这本书里面有大量的统计推导。我们用的比较多的,如聚类分析,一些降维,PCA分析等多元统计分析,非参检验(ks检验、卡方检验)。这本书不但告诉你怎么用这些分析也给出了相应的推导。
c. 《R语言实战》——对于想要个一本通的朋友 (人民邮电出版社和中国工信出版集团 )
4. R语言的下载与安装
5. R语言与Rstudio
• R Studio是一款免费,开源的最好用的R语言的IDE程序(IDE,交互式的开发环境,是在R语言的基础上开发了一套带有代码写作与调试功能的程序。)
▷ 在绘图与帮助区域,第一个标签为Files,可以浏览整个系统中的文件,第二个为Plots,在左边用代码画了个图在这个区域可以出小样。第三个为Export,把图导出。第四个为Packages,能找到所有R语言里已经安装过的包。
• 如何安装和使用R Studio
a. 下载最新版R并成功安装;b. 下载最新版的R Studio并进行安装; c. 打开R Studio设置自己喜欢的颜色与字体;d. 命令行区域输入: print("hello world in R!")
6. R语言的包管理
• R包介绍: R包也称为R程序包,是多个函数的集合,具有详细的说明和示例。
• 完成特定的分析功能,需要用相应的R程序包实现。例如,用ggplot2进行快速绘图;做差异表达分析时用到DESeq;做芯片处理可能需要用到limma, affy等包。
(1)R包的安装
做生物信息学最容易需要接触3类包:
▷ CRAN中的R包 (install.packages("package name"))
CRAN是R的官网,任何人都可以按照该网站的规则提交R包。只要是在CRAN上提交的R包,都可以使用install. package()函数进行安装,但是安装的时候需要联网。
▷ Bioconductor上的R包 (biocLite("package name"))
Bioconductor是一个专门做生物信息学R包的平台,里面发布了各种做生信分析的R包,如最常用的芯片数据分析。
▷ 私人发布的R包....
7. R语言中的基础绘图系统
• R的基础绘图系统
▷ 基础绘图系统中的低级绘图函数:创建画布,点,线,多边形
基础绘图系统中的高级绘图函数:plot(), boxplot(), hist(), density()等等
• R的高级绘图系统
▷ grid绘图系统:基于grid绘图系统开发的ggplot
▷ lattice绘图系统
此文为北京大学 Hovard Meng(孟浩巍博士)知乎live的笔记。侵删。