DAY4 生信入门-函数和R包

.Rmd文件,注释+代码+运行结果一起显示。

函数与参数

1.形式参数与实际参数


参数

2.写函数的函数
把变的地方作为了函数的参数,把不变的地方作为了函数的主体。


写函数的函数

复习:绘图函数plot()
思考:plot画iris的前四列?

test = iris
plot(test[,1],col = test[,5])
plot(test[,2],col = test[,5])
plot(test[,3],col = test[,5])
plot(test[,4],col = test[,5])
col表示颜色,不是缩写。test[,5]有三种数据,所以有三种默认颜色。

当一个代码需要复制粘贴三次,就应该写成函数或使用循环

test=iris
g <- function(i){
  plot(test[,i],col=test[,ncol(test)])
}

g(1)
g(2)
g(3)
g(4)

plot()

3.默认参数
作者会设计很多参数,但只有前1~n个是必须填的,其他的参数都有默认值
默认参数

练习4-1
2、写一个函数,输入参数为一个数值型向量,输出结果为:该向量的“中位数”和“平均数”,并写出用户使用该函数的代码 。

#我的错误代码,不知道如何使两个函数一起输出。
g <- function(x){median(x),mean(x)}

用c()组织了多个数据。
一般来说,函数只有一个返回结果。

#回车和分号效果一样。这样默认返回最后一个函数的值。
> tony <- function(x){
+   mean(x)
+   median(x)
+ }
> tony(a)
[1] 0.2808704
#正确答案
> mdm <- function(x){ 
+     c(mean = mean(x),  #给向量起名字
+       median = median(x)) 
+ } 
> 
> a = rnorm(10)
> mdm(a)
     mean    median 
0.3630620 0.2808704 
> mdm2 <- function(x){ 
+     paste0("mean :",mean(x),
+            ",median:",median(x))
+ } 
> 
> mdm2(a)
[1] "mean :0.363062004529344,median:0.280870440925975"

tips: 有多个输出结果时,将输出的结果组成一个向量; 当一个函数里需要返回多个值(比如有变量,有向量,有矩阵)时,我们要用list,而不是return
函数中常用:retun()/print(),生成多个,最终返回几个,告诉最后要返回/输出的值是谁。

> tony <- function(x){
+   print(c(mean(x),median(x)))
+ }
> tony(a)
[1] 0.3630620 0.2808704

记得检查
函数运行是否成功取决于目的是否达到,而不是取决于是否报错。
函数的括号里不要有赋值语句。
不重要的拓展:制定输入必须为数值型向量。

> mdm <- function(x){ 
+   if(!is.numeric(x))stop("dnflsdkjflskdjfls")
+   c(mean = mean(x),
+     median = median(x)) 
+ }
> mdm("a")
Error in mdm("a") : dnflsdkjflskdjfls

R包(R package)介绍

R程序包是多个函数的集合,具有详细的说明和示例
也有的R包只有数据,没有函数
包含R函数、数据、帮助文件、描述文件等
特定的分析功能,需要用相应的程序包来实现
目的不是学会某个具体的R包,而是找所有R包使用的规律。

R包来源

(1)CRAN网站
http://cran.r-project.org/web/views/
(2)Bioconductor
http://bioconductor.org/
(3)github
http://github.com

R包来源决定安装使用的代码
CRAN:install.packages()
Biocductor: BiocManager::install()
Github:devools::install_github()
github本地安装:devtools::install_local("AnnoProbe-master.zip",upgrade = F)
来源未知?
谷歌、必应搜索包名,即可找到。
前两个命令逐个试一下,一个命令不成功就用另一个。

安装后需要加载才能用
一次安装,每次打开新的session都要加载。
加载:二选一,不加引号,library()或require()

library() 
require()

(国内)R包安装前需设置镜像

方法1:tools–global option-packages-选择中科大或清华
方法2:代码设置
每次下载安装R包的时候都要运行。

options("repos"=c(CRAN="http://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
options(BioC_mirror="http://mirrors.ustc.edu.cn/bioc/")

R包安装和使用的逻辑

1.安装包-加载包-使用包里的函数


R包安装和使用的逻辑

如报错:找不到函数,则加载函数所在的包,重试。
如报错:不存在叫xx名字的包,则安装xx包,重试。
library()是检查是否安装成功的标准

2.已安装、不加载,直接使用

BiocManager::install() 
dplyr::filter()

包名 ::函数名,表示显式的指定用某个包里的某个函数,通常用于实战中仅用一次的函数,也适用于两个包中的函数名有冲突的情况。

常见疑问

(1)大片提示信息
检查是否有error,没有就忽略
(2)packages not available
原因1:包名写错
原因2:安装命令使用错误
原因3:本机的R语言版本与包所要求的版本不符(极少)
(3)是否更新?
懒惰策略,能不更新就不更新,除非一直报错。
不想回答:安装命令加参数:update = F, ask = F
(4)加载A包,报错B包不存在
问是否更新的、“不存在”的是依赖包
R包之间存在复杂的依赖关系 使用A包,就必须同时用B、C, 而C又依赖了D包
理论上: 安装A,就会自动安装BCD ;加载A,就会自动加载BCD
实际上: 常会因为一两个依赖包的安装失败,导致你想安装的那个包安装失败。
(5)报错中有connection或url、404、http
问题可能是没联网,校园网限制,镜像没设置,镜像崩了。
切换镜像,检查网络连接。如果都没有问题,运行

options(download.file.method = 'libcurl')
options(url.method='libcurl')

再重新下载。


满分操作:判断式安装
if(!require(stringr))install.packages("stringr")

R包的使用场景

  • 某流程代码中用到某些包
  • 学绘图,用到ggplot2
  • 别人的代码套自己的数据,报错不会改
  • 大多数包里的函数规律一致,不需要单独学习,用到哪个函数学习哪个函数
  • 少部分包的函数自有语法,例如ggplot2, dplyr等

R包如何使用-获取帮助

1.快速查看函数帮助文档

?max
help(max)
example(seq) #看实例

2.找R包介绍页面(必应直接搜/CRAN/Bioconductor)
3.少数R包有 Cheat Sheets
https://www.rstudio.com/resources/cheatsheets/
补充
网页版说明书:作者写的,详细,类似于教程,不是每个R包都有。

browseVignettes("clusterProfiler") #Vignettes小插图

列出某个包里所有的函数:

> ls("package:clusterProfiler") #前提:包加载并安装。不能自动补齐。
[1] "%<>%" 
[2] "%>%" 
[3] "arrange" 
[4] "bitr" 
[5] "bitr_kegg" 
[6] "browseKEGG" 
[7] "buildGOmap" 
[8] "cnetplot" 
[9] "compareCluster" 
[10] "dotplot"

ls()  #环境里有哪些变量
dir()  #工作目录下的文件

R语言里的符号

() 函数
[] 向量、数据框取子集
[[]] 列表取子集
$ 数据框取列
= ,<- 赋值
== 判断是否相等
!=判断是否不相等
! 否定
{} 多行代码
井号# 注释
"" 字符串
:: 包::函数

认清函数与数据

函数
形式函数:括号里面,等号左边。
实际函数
数据框或矩阵
列表 @:类似于列表取子集的$,R语言里狭义的对象取子集的符号。
文件名

只有像save这样专门为文件设置的函数,才能识别文件名。像class只能将数据识别为字符串。

作者:Ruizheng
链接:https://www.jianshu.com/p/70be54ac9065
来源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容