2020.2.2 R语言|Practice2
今日学习内容一览
一、Jimmy 生信技能树B站P7-P10(课上积累)
二、R语言初级练习题目三道代码过程
三、Markdown和R Markdown的学习网站收藏
-
R语言初级练习题目三道 代码过程
-
根据R包
org.Hs.eg.db
找到下面ensembl 基因ID 对应的基因名(symbol)-
首先得到gene_id和ensemble_id的关系矩阵g2e以及gene_id和symbol的关系矩阵g2s.
library(org.Hs.eg.db) install.packages("org.Hs.eg.db") library(org.Hs.eg.db) g2s=toTable(org.Hs.egSYMBOL) g2e=toTable(org.Hs.egENSEMBL)
-
-
其次绘制出样本矩阵,并提取小数点前面的数字新增一列
a=read.table("寻找基因.txt") library(stringr) library("str_split") str_split(a$V1,'[.]') unlist(str_split(a$V1,'[.]')) class(unlist(str_split(a$V1,'[.]'))) a$ensembl_id=str_split(a$V1,'[.]',simplify = T)[,1]
- 通过共有的ensembl_id建立样本矩阵与g2e的合并矩阵,再通过合并矩阵与g2s共有的gene_id建立第二个合并矩阵,最后通过match函数调整顺序后导出储存即可。
`b=merge(a,g2e,by='ensembl_id',all.x=T)
d=merge(b,g2s,by='gene_id',all.x=T)
d=d[order(d$V1,)]
d=d[match(a$ensembl_id,d$ensembl_id)]
head(match(a$ensembl_id,d$ensembl_id,))
d=d[match(a$ensembl_id,d$ensembl_id),]
write.csv('d,gene find.csv')`
-
根据R包
hgu133a.db
找到下面探针对应的基因名(symbol)-
首先使用read.table函数读取样本文件
rm(list=ls()) options(stringsAsFactors = F) a=read.table('基因ID转换.txt')
-
其次使用hgu133plus2.db这个R包导出probe_id与symbol的对应矩阵,最终使用merge函数合并原样本矩阵和对应矩阵共有的probe_id即可
library(hgu133plus2.db) ids=toTable(hgu133plus2SYMBOL) colnames(ids) colnames(a)='probe_id' d=merge(a,ids,by='probe_id')
-
-
找到R包
CLL
内置的数据集的表达矩阵里面的TP53基因的表达量,并且绘制在progres.-stable
分组的boxplot图-
读取内置数据库CLL并查看矩阵,同时使用pData查看其分组信息
rm(list=ls()) library(CLL) data(sCLLex) expr <- exprs(sCLLex) pdata <- pData(sCLLex) head(expr)
-
-
使用hgu95av2.db这个R包得到probe_id和symbol的表达关系矩阵,再使用grep函数挑选出其中symbol==TP53的probe_id并建立为一个新矩阵
library(hgu95av2.db) probe_sym <- toTable(hgu95av2SYMBOL) tp53_probes <- probe_sym[grep("TP53$", probe_sym$symbol),]
-
使用boxplot函数对三个相应的探针ID绘图
boxplot(expr['1939_at',]~pdata$Disease) boxplot(expr['1974_s_at',]~pdata$Disease) boxplot(expr['31618_at',]~pdata$Disease)
-
最后,使用ggpubr合并图像,调整各项参数,改变检验方法等。
library(ggpubr) tp53_pub <- cbind(expr['1939_at',], as.data.frame(pdata$Disease)) colnames(tp53_pub) <- c('Expression',"Group") p <- ggboxplot(tp53_pub, y='Expression', x='Group',fill = 'Group', palette = 'aaas' ,add = 'jitter')p + stat_compare_means() p + stat_compare_means(method = 't.test')
-
Markdown和R Markdown的学习网站收藏