2020.2.1 R语言|Practice1

一、Day1今天的学习任务:

1.R语言的基础语法检验

2.统计可视化代码练习

3.Jimmy生信技能树B站R系列课程P1——P6 


二、操作过程及步骤含义

1.首先要找到相应的分析数据,下载并导入外部数据

rm(list = ls())

options(stringsAsFactors = F)

getwd()

a=read.table('BioSample.txt',header = T, sep='\t')

b=read.csv("sample.csv")

2.使用merge函数将两个表格重复的名称部分关联起来,得到新表格d,进而取出我们关心的部分“MBases”和"Title"两列重组为表格e

colnames(a)

colnames(b)

d=merge(a,b,by.x = 'Sample_Name',by.y = 'Accession')

e=d[,c("MBases","Title")]



3.存储表格e的数据内容并重新建立分析

save(e,file = 'input.Rdata')

rm(list = ls())

options(stringsAsFactors = F)

load(file = 'input.Rdata')


4.读取e样本信息表格中第三列元素的统计情况(第三列元素代表样本所在plate信息),根据e的第一列数据和plate相关联,绘制boxplot图并将MBases分两组检验是否具有统计学显著差异

e[,2]

plate=unlist(lapply(e[,2],function(x){

  # x=e[1,2]

  x

  strsplit(x,'_')[[1]][3]

}))

table(plate)

boxplot(e[,1]~plate)

t.test(e[,1]~plate)




5.e表格中增加一列plate分类,使用ggplot绘制出以MBases和plate为xy轴的箱线图

e$plate=plate

library(ggplot2)

colnames(e)

ggplot(e,aes(x=plate,y=MBases))+geom_boxplot()


6.ggboxplot创建带有p-value值的箱线图并改变统计方法

library(ggpubr)

install.packages("magrittr")

library(ggplot2)

p <- ggboxplot(e, x = "plate", y = "MBases",

              color = "plate", palette = "jco",

              add = "jitter")

# Add p-value

p + stat_compare_means(method = 't.test')



B站R语言系列听课过程中积累的函数知识点:

1.read.table(x.csv) 导入数据

2. write.csv(x.csv) 存储数据并导出

3.comment.char="!"  注释所有以"!"开头的行名

4.header= T 第一行成为行名,加行标题

5.sep='\t' 以空格分隔符(统一与excel不同的行名定义)

6.rownames= F 去掉行名

7.sort(a$MBases, decreasing=T)[1] 取a中MBases中的最大值

8.max(a$MBases) 取a中MBases列最大值

9.min(a$MBases)取a中MBases列最小值

10.fivenum(a$MBases)取a中MBases列的五分位数

11.table(x) 分组计数

12 .view(x) 浏览表格等

13.as.numeric(x) 将x变为数字格式

14.mean(x) 对x取平均值  rowmeans ()对某行取平均值  head(rowMeans())对每行取平均值

15.for (i in nrow(b)) {

    I=1/2/....

   (print) mean(as.numeric(b[i,]))

    print的存在决定输出与否    

16.apply(b,1,function(x) {

    mean(x)

    })

    同15一样为循环函数,apply循环与for循环的区别在于:

    apply把data.frame里面的每一行元素当作是一个元素

17.apply(b,1,sd) 取每一行数据的方差

    eg:sort(apply(b,1,sd),decreasing= T )[1:50]

    取方差从大到小排列的前50

18.sample(1:nrow(b),50) 在b的1到n行中取随机的50行

19.sacle="row" 绘制热图时的归一化(减小最大值最小值对热图的影响)

20.test=matrix(rnorm(200),20,10) 创建行20列10的随机数矩阵

21. pheatmap(cbind(*1,*2))将热图1和热图2合并

22. paste('a',1:20,sep="_") 快速编码

a_1" "a_2" "a_3" "a_4" "a_5" "a_6" "a_7" "a_8" "a_9" "a_10" "a_11" "a_12" "a_13" "a_14" "a_15" "a_16" "a_17" "a_18" "a_19" "a_20"

23. pheatmap (test, display_numbers=T) 显示热图每小格数据

24. pheatmap(cellwidth=,cellheight=,fontsize=,filename=) 定义热图的基本属性

25. rep(a1,20) 重复a1共计20次

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 205,033评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,725评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,473评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,846评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,848评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,691评论 1 282
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,053评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,700评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 42,856评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,676评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,787评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,430评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,034评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,990评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,218评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,174评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,526评论 2 343

推荐阅读更多精彩内容

  • "use strict";function _classCallCheck(e,t){if(!(e instanc...
    久些阅读 2,027评论 0 2
  • pyspark.sql模块 模块上下文 Spark SQL和DataFrames的重要类: pyspark.sql...
    mpro阅读 9,446评论 0 13
  • 1. 关于诊断X线机准直器的作用,错误的是()。 (6.0 分) A. 显示照射野 B. 显示中心线 C. 屏蔽多...
    我们村我最帅阅读 10,262评论 0 5
  • 在C语言中,五种基本数据类型存储空间长度的排列顺序是: A)char B)char=int<=float C)ch...
    夏天再来阅读 3,323评论 0 2
  • 当黄昏尚未收缩成下一个黎明 太阳便急急后隐于云翳 天边蒸发成飞蛾扑火般的绚丽 稀薄空气里 早已不见飞鸟回旋的高低 ...
    山凉阅读 112评论 0 0