下机数据的完整性检测
1.txt 是下载的数据生成的md5值
md5sum *fastq.gz > 1.txt
md5.txt是公司给的
md5sum -c md5.txt
#fastp质检
for i in A5 A6 A7 A8 A9 A10 A11 B5 B6 B7 B8 B9;do
{
nohup fastp -w 8 -i /home/huoxulei/Desktop/meningiomaceRNA/rawdata/${i}.R1.fastq.gz -o /home/huoxulei/Desktop/meningiomaceRNA/cleandata/${i}.clean_R1.fastq.gz -I /home/huoxulei/Desktop/meningiomaceRNA/rawdata/${i}.R2.fastq.gz -O /home/huoxulei/Desktop/meningiomaceRNA/cleandata/${i}.clean_R2.fastq.gz &
}
done
获取质检结果
for i in A5 A6 A7 A8 A9 A10 A11 B5 B6 B7 B8 B9;do
{
nohup fastqc -t 10 /home/huoxulei/Desktop/meningiomaceRNA/cleandata/${i}.clean_R1.fastq.gz /home/huoxulei/Desktop/meningiomaceRNA/cleandata/${i}.clean_R2.fastq.gz &
}
done
for i in B1 B2 B3 B4;do
{
nohup fastqc -t 10 /home/huoxulei/Desktop/meningiomaceRNA/cleandata/${i}_B_Clean_Data1.fq.gz /home/huoxulei/Desktop/meningiomaceRNA/cleandata/${i}_B_Clean_Data2.fq.gz &
}
done
for i in M1 M2 M3 M4;do
{
nohup fastqc -t 10 /home/huoxulei/Desktop/meningiomaceRNA/cleandata/${i}_M_Clean_Data1.fq.gz /home/huoxulei/Desktop/meningiomaceRNA/cleandata/${i}_M_Clean_Data2.fq.gz &
}
done
合并
nohup multiqc . &
去除rRNA
for i in A5 A6 A7 A8 A9 A10 A11 B5 B6 B7 B8 B9;do
{
nohup bowtie2 -x /home/huoxulei/Desktop/meningiomaceRNA/rRNA/hg38_rRNA -1 /home/huoxulei/Desktop/meningiomaceRNA/cleandata/${i}.clean_R1.fastq.gz -2 /home/huoxulei/Desktop/meningiomaceRNA/cleandata/${i}.clean_R2.fastq.gz --un-conc-gz /home/huoxulei/Desktop/meningiomaceRNA/cleandata/${i}_rRNA_result.fastq.gz -p 8 -S /home/huoxulei/Desktop/meningiomaceRNA/cleandata/${i}_rRNA.sam 2>/home/huoxulei/Desktop/meningiomaceRNA/cleandata/${i}.xls &
}
done
for i in B1 B2 B3 B4;do
{
nohup bowtie2 -x /home/huoxulei/Desktop/meningiomaceRNA/rRNA/hg38_rRNA -1 /home/huoxulei/Desktop/meningiomaceRNA/cleandata/${i}_B_Clean_Data1.fq.gz -2 /home/huoxulei/Desktop/meningiomaceRNA/cleandata/${i}_B_Clean_Data2.fq.gz --un-conc-gz /home/huoxulei/Desktop/meningiomaceRNA/cleandata/${i}_rRNA_result.fastq.gz -p 8 -S /home/huoxulei/Desktop/meningiomaceRNA/cleandata/${i}_rRNA.sam 2>/home/huoxulei/Desktop/meningiomaceRNA/cleandata/${i}.xls &
}
done
for i in M1 M2 M3 M4;do
{
nohup bowtie2 -x /home/huoxulei/Desktop/meningiomaceRNA/rRNA/hg38_rRNA -1 /home/huoxulei/Desktop/meningiomaceRNA/cleandata/${i}_M_Clean_Data1.fq.gz -2 /home/huoxulei/Desktop/meningiomaceRNA/cleandata/${i}_M_Clean_Data2.fq.gz --un-conc-gz /home/huoxulei/Desktop/meningiomaceRNA/cleandata/${i}_rRNA_result.fastq.gz -p 8 -S /home/huoxulei/Desktop/meningiomaceRNA/cleandata/${i}_rRNA.sam 2>/home/huoxulei/Desktop/meningiomaceRNA/cleandata/${i}.xls &
}
done
比对 hisat2
##GRCH38_snp_trans 作为索引A6
for i in A5 A6 A7 A8 A9 A10 A11 B5 B6 B7 B8 B9 B1 B2 B3 B4 M1 M2 M3 M4;
do
{
nohup hisat2 --dta -p 16 -x /home/huoxulei/Desktop/index/hisat/grch38_snp_tran/genome_snp_tran -1 /home/huoxulei/Desktop/meningiomaceRNA/cleandata/${i}_rRNA_result.fastq.1.gz -2 /home/huoxulei/Desktop/meningiomaceRNA/cleandata/${i}_rRNA_result.fastq.2.gz -S /home/huoxulei/Desktop/meningiomaceRNA/cleandata/${i}.sam
2>/home/huoxulei/Desktop/meningiomaceRNA/cleandata/${i}.csv &
}
done
#但是这个时候 生成的sam文件 没法用于下面的stringtie分析,所以需转成bam,以及要进行排序 index是无作用的,对于分析
samtools 把sam 转为bam,并排序
for i in A5 A6 A7 A8 A10 A11 B5 B6 B7 M1 M2;
do
{
nohup samtools sort -@ 16 -o /home/huoxulei/Desktop/meningiomaceRNA/bam/${i}.bam /home/huoxulei/Desktop/meningiomaceRNA/cleandata/${i}.sam &
}
done
=
##