1.函数与参数
1.1 形式参数与实际参数
1.2 写函数的函数
- 函数:括号前
- 形式参数:等号前(有时形式参数可省略)
- 实际参数:等号后,可默认,可更改(以使用者为准)
g <- function(x,y=0.5){
seq(x,3*x,y)
}
#{}内为编写函数使用的代码
g(2)
## [1] 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0
g(1,1)
## [1] 1 2 3
g(x=3,y=6)
## [1] 3 9
#复习:绘图函数plot()
par(mfrow = c(2,2)) #把画板分成两行两列
x = c(2,5,6,2,9);plot(x)
x = seq(2,80,4);plot(x)
x = rnorm(10);plot(x)
x = iris$Sepal.Length;plot(x)
#思考:plot画iris的前四列?
test = iris
plot(test[,1],col = test[,5])
plot(test[,2],col = test[,5])
plot(test[,3],col = test[,5])
plot(test[,4],col = test[,5])
当一个代码需要复制粘贴三次,就应该写成函数或使用循环
test=iris
g <- function(i){
plot(test[,i],col=test[,ncol(test)])
}
g(1)
g(2)
g(3)
g(4)
1.3 默认参数
作者会设计很多参数,但只有前1~n个是必须填的,其他的参数都有默认值。
2.R包(R package)
2.1 R包介绍
R包是什么?
R包是多个函数的集合,具有详细的说明和示例。 包含R函数、数据、帮助文件、描述文件等。
为什么要安装R包?
特定的分析功能,需要用相应的程序包实现。 例如:作图包ggplot2,差异分析包limma等等。
伪问题:学一个R包要多久?
目的不是学会某个具体的R包,而是找所有R包使用的规律。
2.2 R包来源
(1)CRAN网站
http://cran.r-project.org/web/views/
(2)Bioconductor
http://bioconductor.org/
(3)github
http://github.com
2.3 R包安装前需设置镜像
镜像
镜像网站相当于主网站的副本,在访问主网站存在障碍时,访问镜像 网站也可。
R和Bioconductor主网站位于国外,选择国内的镜像可加快访问速度。
国内镜像推荐
清华镜像(tuna,Beijing)
中科大镜像(ustc,Hefei)
镜像设置方法
方法1:tools–global option-packages-选择中科大或清华
方法2:代码设置
options("repos"=c(CRAN="http://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
options(BioC_mirror="http://mirrors.ustc.edu.cn/bioc/")
2.4 用于R包安装与加载的函数
R包来源决定安装使用的代码
- CRAN:
install.packages()
- Biocductor:
BiocManager::install()
- Github:
devools::install_github()
from CRAN
例:tidyr
install.packages("tidyr")
install.packages('tidyr_1.1.3.tar.gz',repos = NULL) #本地安装
from Biocductor
#需先安装BiocManager
install.packages('BiocManager')
BiocManager::install("ggplot2")
from github
install.packages('devtools')
devtools::install_github("jmzeng1314/AnnoProbe") #括号里写作者用户名/包名
devtools::install_local("AnnoProbe-master.zip",upgrade = F) #网络问题经常导致github访问不了,可选择本地安装,本地安装,放在工作目录下
不知道R包从哪里来
- 谷歌、必应(英文版)搜索包名,即可找到。
- 前两个命令逐个试一下,一个命令不成功就用另一个。
安装后需要加载才能用 - 一次安装,每次打开新的session都要加载。
- 加载:二选一,不加引号,library()或require()
- library是检查是否安装成功的标准
library(tidyr)
require(tidyr)
避免重复安装万能功能
if(!require(factoextra))install.packages('factoextra') #若运行T则安装,F则不安装
2.5 R包安装和使用的逻辑
(1)安装包-加载包-使用包里的函数
- 如报错:找不到函数,则加载函数所在的包,重试。
- 如报错:不存在叫xx名字的包,则安装xx包,重试。
- library()是检查是否安装成功的标准
(2)已安装、不加载,直接使用
BiocManager::install()
dplyr::filter()
包名 ::函数名,表示显式的指定用某个包里的某个函数,通常用于实战中仅用一次的函数,也适用于两个包中的函数名有冲突的情况。
2.6 安装R包常见疑问
(1)大片提示信息
检查是否有error,没有就忽略
(2)packages not available
- 原因1:包名写错
- 原因2:安装命令使用错误
- 原因3:本机的R语言版本与包所要求的版本不符(极少,99%情况下没有问题)
(3)是否更新?
- 懒惰策略,能不更新就不更新,除非一直报错
- 不想回答:安装命令加参数:update = F, ask = F,或者选a/n
- 问是否更新的、“不存在”的是依赖包
(4)加载A包,报错B包不存在
- 先安装B包,安装成功后再安装A包
- 它问是否更新、“不存在”的是依赖包
R包之间存在复杂的依赖关系,使用A包,就必须同时用B、C,而C又依赖了D包。理论上: 安装A,就会自动安装BCD,加载A,就会自动加载BCD;实际上:常会因为一两个依赖包的安装失败,导致你想安装的那个包安装失败。解决办法就是缺啥补啥。
- 报错说依赖包版本不够新:那就更新
- 更新一个包:重新安装,或先删除再重新安装;更新所有的包:
update.packages()
(5)报错中有connection、url、404、http
切换镜像,检查网络连接。如果都没有问题,运行
options(download.file.method = 'libcurl')
options(url.method='libcurl')
再重新下载
2.7.获取帮助
(1)快速查看函数帮助文档
?max
或者help("max")
,主要看描述/参数/实例。
?seq
help("seq")
example("seq")
(2)找R包介绍页面(CRAN或Bioconductor)
可以找到该R包最详细的介绍,包括安装使用的代码及详细的pdf文档。
(3)少数R包有cheatsheets
https://www.rstudio.com/resources/cheatsheets/
(4) Vignettes
browseVignettes("stringr")
补充:列出一个包里都有那些函数
ls("package:stringr")
## [1] "%>%" "boundary" "coll" "fixed"
## [5] "fruit" "invert_match" "regex" "sentences"
## [9] "str_c" "str_conv" "str_count" "str_detect"
## [13] "str_dup" "str_ends" "str_extract" "str_extract_all"
## [17] "str_flatten" "str_glue" "str_glue_data" "str_interp"
## [21] "str_length" "str_locate" "str_locate_all" "str_match"
## [25] "str_match_all" "str_order" "str_pad" "str_remove"
## [29] "str_remove_all" "str_replace" "str_replace_all" "str_replace_na"
## [33] "str_sort" "str_split" "str_split_fixed" "str_squish"
## [37] "str_starts" "str_sub" "str_sub<-" "str_subset"
## [41] "str_to_lower" "str_to_sentence" "str_to_title" "str_to_upper"
## [45] "str_trim" "str_trunc" "str_view" "str_view_all"
## [49] "str_which" "str_wrap" "word" "words"