生信星球 DAY 4,5,6 — R语言入门 ...

R语言.png

一 .什么是R,R studio,R包

  • R是一种编程语言,也是统计计算和绘图的环境,它汇集了许多函数,能够提供强大的功能
  • Rstudio是R语言的集成开发环境(Integrated Development Environment)。 相对于R,R studio界面更人性化(必须先装R,才能使用RStudio)
  • R包是R的扩展,相当于把R的函数进行打包用于实现某种特定目的。通过利用已有的R包你可以更快更简单的实现自己的目的,而不需要用R语言一点点编写完成自己的目的。


    R studio 操作界面.png

二. R,R studio 的安装

R及Rstudio的安装
当Rstudio杠上中文用户名

三 . R的使用

1.R studio的外观设置
Tools--Global Options--Appearance


外观设置

数据处理
2.R studio界面介绍

2.1脚本编辑区

  • 功能键
    Save:保存
    放大镜:查询替换
    荧光棒:代码工具
    笔记本:脚本编辑报告
    Run:运行
    Re-run:再运行
  • 快捷键
    新建脚本:Ctrl+Shift+C
    编辑代码
    运行所有/指定代码:Ctril+Shift+Enter/Ctril+Enter
    补全:Tab
    选择替换:Ctrl+F
    赋值:Alt+-
  1. 2控制台(Console)
    • 功能键
      箭头:曾用工作目录
      扫帚:清空控制台

    • 快捷键
      中断:Esc
      全部清空:Ctrl+L
      上下条历史命令:上/下箭头

2.3 工作空间(Workspace)和历史(History)窗口

  • Environment: 查看变量
  • History: 历史代码
  1. 画图和帮助窗口
    • Files:工作目录和文件
    • Plot:图片查看与输出
    • Package:R包
    • Help: 帮助文档

二. 基本函数

1.管理工作目录
设置保存文件夹:set("文件夹路径")
查看保存文件夹:getwd()
对于多个并行项目可以新建new project

2.显示文件列表
dir ()
list.file()

3.赋值:
将x定义为由元素1,2,3组成的向量 : x<- c(1,2,3)
1-10之间所有的整数: x<- 1:10
1-10之间每隔0.5取一个数: x<- seq(1,10,by = 0.5)
1-3 重复2次: x<- rep(1:3,times=2)

4.删除变量
单一:rm()
多个:rm(a,b)

5.列出历史记录
所有:history()
指定数量:history(n)

三. 数据类型

1.向量;一维

 #提取元素
       #根据元素位置

            x[4] #x第4个元素
            x[-4]#排除法,除了第4个元素之外剩余的元素
            x[2:4]#第2到4个元素
            x[-(2:4)]#除了第2-4个元素
            x[c(1,5)] #第1个和第5个元素
       
 #根据值


            x[x==10]#等于10的元素
            x[x<0] #小于0的元素
            x[x %in% c(1,2,5)]#存在于向量c(1,2,5)中的元素

2.矩阵:二维,多个长短,类型均相同的向量

3.数据框:多个长短,类型均可不同的变量,比如表格

#设定工作目录(见基本函数)

#读取数据
    read.table/csv/...( )

          file:文件的相对路径或者绝对路径,Windows下路径要用/或\\
          sep:分隔符,默认为空格。可以设置为',',';'和制表符(tab)
          header:设置为T时第一行作为列名
          如果数据集中含有中文,加上参数fileEncoding='utf-8'
          Excel表格未转化成csv格式,可以安装readxl包,read_excel()


#  提取行,列名
      colnames(X) #查看列名
      rownames(X) #查看行名
      colnames(X)[1]<-"A"#修改第一列名为A

#  提取元素,X为变量名
      X[x,y]#第x行第y列
       X[x,]#第x行
       X[y]或X[,y]#第y列
      X[a:b]#第a列到第b列
       X[c(a,b)]#第a列和第b列
      X$列名#也可以提取列

 # 数据框导出
      write.table(X,file = "yu.txt",sep = ",",quote=F)
          X:需要导出的数据
          file:导出的文件路径
          sep:分隔符,默认为空格(" "),也就是以空格为分割列
          row.names:是否导出行序号,默认为TRUE,也就是导出行序号
          col.names:是否导出列名,默认为TRUE,也就是导出列名
          quote:字符串是否使用引号表示,默认为TRUE,也就是使用引号表示


 # 保存及重新加载
      save.image(file="A.RData")#保存当前所有变量,格式为R.data
      save(X,file="test.RData")#保存其中一个变量
      load("test.RData")#再次使用RData时的加载命令

四.R 包安装加载

  1. 设置镜像

    1.1 新建R的配置文件:file.edit('~/.Rprofile')

    1.2 运行:options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) 清华源或options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") #对应中科大源,然后保存并重启Rstudio。

    1.3 查看镜像来源:options() $ repos/BioC_mirror

  2. 安装加载R包

    安装:install.packages("包")
    加载: library(包)

  3. 数据处理之dplyr包
    相信我,这是全网最详细的dplyr教程

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 1. 配置Rstudio的下载镜像 1.配置镜像的原因 为了加速下载R包 2.镜像配置的方法:https://mp...
    President114马阅读 262评论 0 0
  • R语言当中的包主要来自两个地方: 官方网站的资源库CRANbioconductor上的包repos:代表镜像,op...
    嘿嘿_c264阅读 193评论 0 0
  • Day6 R包学习 2020-2-19 1. 了解R包 R包是多个函数的集合,具有详细的说明和示例。 学生信,R...
    chenxiaoxi阅读 404评论 0 0
  • 学习R包R包是多个函数的集合,具有详细的说明和示例。学生信,R语言必学的原因是丰富的图表和Biocductor上面...
    邱qiu爱学习阅读 163评论 0 0
  • R包的使用举例 如何配置镜像 前面提到过,配置镜像是为了加快下载速度,所以 首先 我们要先配置镜像。具体参考文章:...
    呛_27c5阅读 318评论 0 1