1. 数据来源于这个网站,下载水稻所有RNA-seq数据
2. 准备自己的基因IDs文件, 注意基因是一行,而且空格隔开。
3. 利用脚本提取所有目标基因的所有样本的表达谱数据
perl extract_SRA.pl ALl_clusterI_genes.txt ../epigenetic_regulators/ALL_PFKM.txt >ALL_clusterI_FPKM.txt
4. 处理提取的数据,把每一列的列名之间从\t
换成空格
。
5. 选择自己感兴趣的处理组(来自SRAIDs.xls),可以选择一个基因在网站进行搜索 下载所有SRA号和对应处理,以方便后续选择。
6.准备SRA IDs,每个SRA ID一行
7.提取,注意目前Perl脚本有点bug最后一个SRA提取不到,需要写两遍(仅仅最后一个写两遍)。
perl Ectrac_SRA.pl Title.txt SRAIDs.txt ALL_clusterI_FPKM.txt >Submerge_stress_FPKM.txt