.Rmd文件,注释+代码+运行结果一起显示。
函数与参数
1.形式参数与实际参数
2.写函数的函数
把变的地方作为了函数的参数,把不变的地方作为了函数的主体。
复习:绘图函数plot()
思考:plot画iris的前四列?
test = iris
plot(test[,1],col = test[,5])
plot(test[,2],col = test[,5])
plot(test[,3],col = test[,5])
plot(test[,4],col = test[,5])
col表示颜色,不是缩写。test[,5]有三种数据,所以有三种默认颜色。
当一个代码需要复制粘贴三次,就应该写成函数或使用循环。
test=iris
g <- function(i){
plot(test[,i],col=test[,ncol(test)])
}
g(1)
g(2)
g(3)
g(4)
3.默认参数
作者会设计很多参数,但只有前1~n个是必须填的,其他的参数都有默认值。
练习4-1
2、写一个函数,输入参数为一个数值型向量,输出结果为:该向量的“中位数”和“平均数”,并写出用户使用该函数的代码 。
#我的错误代码,不知道如何使两个函数一起输出。
g <- function(x){median(x),mean(x)}
用c()组织了多个数据。
一般来说,函数只有一个返回结果。
#回车和分号效果一样。这样默认返回最后一个函数的值。
> tony <- function(x){
+ mean(x)
+ median(x)
+ }
> tony(a)
[1] 0.2808704
#正确答案
> mdm <- function(x){
+ c(mean = mean(x), #给向量起名字
+ median = median(x))
+ }
>
> a = rnorm(10)
> mdm(a)
mean median
0.3630620 0.2808704
> mdm2 <- function(x){
+ paste0("mean :",mean(x),
+ ",median:",median(x))
+ }
>
> mdm2(a)
[1] "mean :0.363062004529344,median:0.280870440925975"
tips: 有多个输出结果时,将输出的结果组成一个向量; 当一个函数里需要返回多个值(比如有变量,有向量,有矩阵)时,我们要用list,而不是return
函数中常用:retun()/print(),生成多个,最终返回几个,告诉最后要返回/输出的值是谁。
> tony <- function(x){
+ print(c(mean(x),median(x)))
+ }
> tony(a)
[1] 0.3630620 0.2808704
记得检查
函数运行是否成功取决于目的是否达到,而不是取决于是否报错。
函数的括号里不要有赋值语句。
不重要的拓展:制定输入必须为数值型向量。
> mdm <- function(x){
+ if(!is.numeric(x))stop("dnflsdkjflskdjfls")
+ c(mean = mean(x),
+ median = median(x))
+ }
> mdm("a")
Error in mdm("a") : dnflsdkjflskdjfls
R包(R package)介绍
R程序包是多个函数的集合,具有详细的说明和示例
也有的R包只有数据,没有函数
包含R函数、数据、帮助文件、描述文件等
特定的分析功能,需要用相应的程序包来实现
目的不是学会某个具体的R包,而是找所有R包使用的规律。
R包来源
(1)CRAN网站
http://cran.r-project.org/web/views/
(2)Bioconductor
http://bioconductor.org/
(3)github
http://github.com
R包来源决定安装使用的代码
CRAN:install.packages()
Biocductor: BiocManager::install()
Github:devools::install_github()
github本地安装:devtools::install_local("AnnoProbe-master.zip",upgrade = F)
来源未知?
谷歌、必应搜索包名,即可找到。
前两个命令逐个试一下,一个命令不成功就用另一个。
安装后需要加载才能用
一次安装,每次打开新的session都要加载。
加载:二选一,不加引号,library()或require()
library()
require()
(国内)R包安装前需设置镜像
方法1:tools–global option-packages-选择中科大或清华
方法2:代码设置
每次下载安装R包的时候都要运行。
options("repos"=c(CRAN="http://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
options(BioC_mirror="http://mirrors.ustc.edu.cn/bioc/")
R包安装和使用的逻辑
1.安装包-加载包-使用包里的函数
如报错:找不到函数,则加载函数所在的包,重试。
如报错:不存在叫xx名字的包,则安装xx包,重试。
library()是检查是否安装成功的标准
2.已安装、不加载,直接使用
BiocManager::install()
dplyr::filter()
包名 ::函数名,表示显式的指定用某个包里的某个函数,通常用于实战中仅用一次的函数,也适用于两个包中的函数名有冲突的情况。
常见疑问
(1)大片提示信息
检查是否有error,没有就忽略
(2)packages not available
原因1:包名写错
原因2:安装命令使用错误
原因3:本机的R语言版本与包所要求的版本不符(极少)
(3)是否更新?
懒惰策略,能不更新就不更新,除非一直报错。
不想回答:安装命令加参数:update = F, ask = F
(4)加载A包,报错B包不存在
问是否更新的、“不存在”的是依赖包
R包之间存在复杂的依赖关系 使用A包,就必须同时用B、C, 而C又依赖了D包
理论上: 安装A,就会自动安装BCD ;加载A,就会自动加载BCD
实际上: 常会因为一两个依赖包的安装失败,导致你想安装的那个包安装失败。
(5)报错中有connection或url、404、http
问题可能是没联网,校园网限制,镜像没设置,镜像崩了。
切换镜像,检查网络连接。如果都没有问题,运行
options(download.file.method = 'libcurl')
options(url.method='libcurl')
再重新下载。
if(!require(stringr))install.packages("stringr")
R包的使用场景
- 某流程代码中用到某些包
- 学绘图,用到ggplot2
- 别人的代码套自己的数据,报错不会改
- 大多数包里的函数规律一致,不需要单独学习,用到哪个函数学习哪个函数
- 少部分包的函数自有语法,例如ggplot2, dplyr等
R包如何使用-获取帮助
1.快速查看函数帮助文档
?max
help(max)
example(seq) #看实例
2.找R包介绍页面(必应直接搜/CRAN/Bioconductor)
3.少数R包有 Cheat Sheets
https://www.rstudio.com/resources/cheatsheets/
补充
网页版说明书:作者写的,详细,类似于教程,不是每个R包都有。
browseVignettes("clusterProfiler") #Vignettes小插图
列出某个包里所有的函数:
> ls("package:clusterProfiler") #前提:包加载并安装。不能自动补齐。
[1] "%<>%"
[2] "%>%"
[3] "arrange"
[4] "bitr"
[5] "bitr_kegg"
[6] "browseKEGG"
[7] "buildGOmap"
[8] "cnetplot"
[9] "compareCluster"
[10] "dotplot"
ls() #环境里有哪些变量
dir() #工作目录下的文件
R语言里的符号
() 函数
[] 向量、数据框取子集
[[]] 列表取子集
$ 数据框取列
= ,<- 赋值
== 判断是否相等
!=判断是否不相等
! 否定
{} 多行代码
井号# 注释
"" 字符串
:: 包::函数
认清函数与数据
函数
形式函数:括号里面,等号左边。
实际函数
数据框或矩阵
列表 @:类似于列表取子集的$,R语言里狭义的对象取子集的符号。
文件名
包
只有像save这样专门为文件设置的函数,才能识别文件名。像class只能将数据识别为字符串。
作者:Ruizheng
链接:https://www.jianshu.com/p/70be54ac9065
来源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。