2021-11-21 免疫分型

只摘抄,待日后整理

免疫分为六种亚型,用包去做

ImmuneSubtypeClassifier

包的安装需要github,可能有网络要求

现在安装完,记录一下过程

一种用包再做一下

library(devtools)

install_github("Gibbsdavidl/ImmuneSubtypeClassifier")

install.packages("Rtools")

install.packages("ImmuneSubtypeClassifier")

在安装过程中有网络要求,提示有什么包就安装什么包

整理后的表达矩阵就是未经log化的(log与不log是没有区别的)

download.file(url ='https://raw.githubusercontent.com/CRI-iAtlas/shiny-iatlas/develop/data/ebpp_test1_1to20.tsv', destfile ='ebpp_test.tsv')

dat <- read_tsv('ebpp_test.tsv')

dat2 <-as.data.frame(dat[!duplicated(dat$GeneID),])

Xmat <- dat2[,-1]

rownames(Xmat) <- dat2[,1]

Xmat[101:104,1:4]

##XY1XY2XY3XY4

##ABCE11375.6001202.25953.933909.373

##ABCF11239.6701664.881192.710635.941

##ABCF2978.8661590.792497.4101848.180

##ABCF38834.7703333.382428.6805329.980

是一个表达矩阵,行是基因名,列是样本名

res0<-callEnsemble(X=Xmat,geneids='symbol')

res0

得到一个表达矩阵

这个数据类型是原始数据还是经过处理的()

区分免疫亚型用到了485个关键的基因。geneMatchErrorReport告诉你有多少基因是在输入数据中不存在的,如果比例过高,那最终计算出来的亚型就不那么可靠。

原数据是没有分组的,为了体现不同组的亚型比较,这里加上一列分组,仅做例子。

对数据进行可视化

1,输入数据

2,用包做

3,检查错误

4,可视化

geneMatchErrorReport(X=Xmat, geneid='symbol')

geneMatchErrorReport告诉你有多少基因是在输入数据中不存在的,如果比例过高,那最终计算出来的亚型就不那么可靠。


#直接UCSC数据库查看就可以

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容