1数据获得
wget -c https://sra-downloadb.be-md.ncbi.nlm.nih.gov/sos5/sra-pub-zq-11/SRR002/086/SRR2086315/SRR2086315.sralite.1
wget -c https://sra-downloadb.be-md.ncbi.nlm.nih.gov/sos5/sra-pub-zq-11/SRR002/086/SRR2086320/SRR2086320.sralite.1
2 格式转换
ls *.sra|while read id;
do
fastq-dump --gzip --split-3 $id;
done
3 质控
主要是看是否有接头序列
ls *.gz|while read id;
do
fastqc -t 2 $id; #t 线程
done
4. 去除接头
接头序列:GATCGGAAGAGCGGTTCAGCAGGAATGCCGAG
ls *.fastq.gz|while read id;
do
fastp -a GATCGGAAG -i $id -o ${id%%.*}.clean.fq.gz -h ${id%%.*}.html;
done
去除完接头最好再次质控
5 序列比对
ls *.fq.gz|while read id;
do
bowtie2 -p 2 --local \
-x /media/luozhixin/0000678400004823/Indexs/bowtie2/GCA_000001405.15_GRCh38_no_alt_analysis_set.fna.bowtie_index/GCA_000001405.15_GRCh38_no_alt_analysis_set.fna.bowtie_index \
-U $id 2>$id%%.*}.bt2.log \
|samtools sort -@ 2 -o ${id%%.*}_bt2p.bam
samtools index ${id%%.*}_bt2p.bam
done
参考文件
Chip-seq分析5: bowtie2比对 (qq.com)
我的第一次ChIP-seq实践 (qq.com)
一文讲明白ChIP-seq:高分文章里为什么做ChIP-seq? - 知乎 (zhihu.com)