在网上下载了txt文件,是rpkm,但是基因id中的名称搜索不到匹配内容。
试一下用r注释:https://www.jianshu.com/p/ae94178918bc
1、我们先下载r包:
install packages失败可以:
source("https://bioconductor.org/biocLite.R")
biocLite("AnnotationHub") (括号内是安装的包)
library(AnnotationHub)
ah=AnnotationHub() 可以说是加载得相当慢了。。。。
ah$species[which(ah$species == "Arabidopsis thaliana")] 查看你的物种在不在
也可以使用:grs <- query(ah, "Arabidopsis thaliana") query函数
2、用DESeq2处理数据
https://www.jianshu.com/p/3a0e1e3e41d0
测序数据做为countdata使用,要自己提前做一个coldata。全部按照网页教程做,有一步:
conditions<-factor(colnames(mydata)) 这样比较方便
整个操作进行了一遍后发现,有很大的问题。
首先deseq2不支持没有重复的数据,其次数据必须是整数,rpkm不是。所以我们白做了,rpkm数据可以直接画图了,但是想要得到p值检验等我们需要倒推到read count才可以。