在GEO中下载MINiML formatted family file(s)
setwd("C:/AW")
PROBE=c("26540_at","76571_s_at")#目标基因的两个探针
PROBE=as.data.frame(PROBE)
colnames(PROBE)="probe"
a=list.files("GSE39582_family") #提取GSE39582_family文件夹下所有文件名
n=length(a) #GSE39582_family文件夹文件数量
for(i in 1:n){
b[i]=substring(a[i],1,10) #在文件名中取前10即样本名
}
dir=paste("./GSE39582_family",a,sep="/")
merge.data=read.delim(file=dir[1],header=F) #提取第一个文件
colnames(merge.data)=c("probe",b[1]) #列名
for(i in 2:n){
new.data=read.delim(file=dir[i],header=F)
colnames(new.data)=c("probe",b[i])
merge.data=merge(merge.data,new.data,by="probe") #根据“probe”列合并文件
}
write.csv(merge.data,file = "./GSE39582_family/merge.csv",row.names=F) #输出合并文件
expression=merge(merge.data,PROBE,by="probe",all=F) #提取合并文件中目标基因列
write.csv(expression,file = "./GSE39582_family/GSE39582C1.csv",row.names=F) #输出目标基因文件
参考:https://blog.csdn.net/weixin_40645816/article/details/82110057