转录组分析——四、数据质控

数据质控:fastqc
fastqc软件可以对fastq格式的原始数据进行质量统计,评估测序结果,为下一步修剪过滤提供参考

fastqc的常用参数

  1. -h 打印fastqc的帮助信息
  2. -o 设置输出目录,此文件夹一定要存在,否则无法生成结果;若不设置此参数,默认将结果输出到文件所在文件夹
  3. -j 制定Java的路径,否则Java命令存在于系统环境变量 PATH中
  4. -f 制定输入格式,默认为fastq,可选格式为:bam、sam
  5. -t 线程数
  6. -v 软件版本信息
  7. -d 存放质控过程中产生的临时文件,如不设置,则使用系统的临时目录
#创建储存输出结果的文件夹
mkdir qc
#创建文件夹地址变量
fqdir=/trainee2/Mar7/rna/project/fq
qcdir=/trainee2/Mar7/rna/project/qc
#多个数据质控
fastqc -t 10 -o ${qcdir} ${fqdir}/SRR*.fastq.gz
#######################分割线#######################
# 如果样本比较大,用vim写脚本,然后挂到后台
vim qc.sh   # 在脚本里写入命令,命令里含有自定义变量,也要写到脚本里
fqdir=/trainee2/Mar7/rna/project/fq
qcdir=/trainee2/Mar7/rna/project/qc
fastqc -t 10 -o ${qcdir} ${fqdir}/SRR*.fastq.gz    
touch finished.ok    #任务结束后的提示
# 挂到后台
nohup sh qc.sh >qc.log &

multiqc整合fastqc结果

multiqc *.zip
#也可以用vim写在前面的命令脚本里
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容