人类基因组数据分析（基础）-谢勇飞

本次选择的细胞系是GSE5610人类细胞系
首先GEO下载细胞系，获得counts数
1.转格式为csv格式
2.打开，构建数据透视表
好，代码块又来了，哈哈

图片你盗不走

代码如下：为了方便拷贝，我设置了程序框

us_count<-read.csv("巴拉巴拉.csv",head=T,row.names=1) #输入表达矩阵数据路径
us_count<-round(us_count,digits=0) #将输入数据取整
#准备
us_count<-as.matrix(us_count) #将数据转换为矩阵格式
condition<-factor(c("C","C","T","T")) ## 设置分组信息，建立环境(8个样本，2组处理)
coldata<-data.frame(row.names=colnames(us_count),condition)  
coldata
condition
library(DESeq2) #使用library函数加载DEseq2包
##构建dds矩阵
dds<-DESeqDataSetFromMatrix(us_count,coldata,design=~condition)
head(dds) #查看构建好的矩阵
##进行差异分析
dds<-DESeq(dds) #对原始的dds进行标准化
resultsNames(dds)  #查看结果名称
res<-results(dds) #用results函数提取结果，并赋值给res变量
summary(res) #查看结果
plotMA(res,ylim=c(-2,2)) 
mcols(res,use.names=TRUE)
plot(res$log2FoldChange,res$pvalue) #绘制火山图
#提取差异基因
res <- res[order(res$padj),]
resdata <-merge(as.data.frame(res),as.data.frame(counts(dds,normalize=TRUE)),by="row.names",sort=FALSE)
deseq_res<-data.frame(resdata)
up_diff_result<-subset(deseq_res,padj < 0.05 & (log2FoldChange > 1)) #提取上调差异表达基因
down_diff_result<-subset(deseq_res,padj < 0.05 & (log2FoldChange < -1)) #提取下调差异表达基因

write.csv(up_diff_result,"上调_day0_VS_day1_diff_results.csv") #输出上调基因
write.csv(down_diff_result,"下调_day0_VS_day1_diff_results.csv") #输出下调基因

好啦，就这样了

可甜可咸

人类基因组数据分析（基础）-谢勇飞

推荐阅读更多精彩内容