featurecounts的输出文件
查看featurecounts输出文件:
第一行是运行代码,第一列为基因名,第七列为每个基因上的count数,现在要舍去第一行,并只保留第一列和第七列:
cut -f 1,7 SRR830973.counts.txt |grep -v '^#' >SRR830973.fc.txt
#-v: 显示不包含匹配文本的所有行
#写循环处理15个心衰样本:
for i in {830973,830974,830975,830976,830977,830978,830979,830980,830981,830982,830983,830984,830985,830987,830988}
do
cut -f 1,7 SRR${i}.counts.txt|grep -v '^#' >SRR${i}.fc.txt
done
得到如下文件:
接下来用R分析:
在C:\Users\tdy1995\Desktop\GSE46224文件夹里,脚本为countnew.R,输入文件为GSE46224里15个心衰样本,经过STAR比对及featurecounts计数后的txt文件(SRR830973.fc.txt),输出文件为表达矩阵symbol.txt。
然后用perl脚本提取RBP的表达量,输入文件为全部基因表达矩阵symbol.txt、RBP的名字RBPgene.txt,perl脚本为AS.getSFexp.pl,输出文件为RBPexp.txt。