莎莎写于2020.5.1
学校第一批返校的同学已经解封了,我还在宾馆隔离
我今天在这里立个Flag:每天都要写简书✍
哈哈哈,可能不太现实,但是至少今天是新的一个月的开始
要好好学习!!!
好啦,今天学习比对到参考基因组,我们拿到经过剪切reads的数据之后,就需要比对到参考基因组,这里学习两个软件:hisat2和subjunc
首先需要构建基因组索引,
① 官网构建好的索引地址:ftp://ftp.ccb.jhu.edu/pub/infphilo/hisat2/data/
官网上有的最好下载使用
② 可以通过hisat2-build构建基因组索引
索引构建好之后就可以进行转录组数据的比对
(1)Hisat2
Hisat2:graph-based alignment of next generation sequencing reads to a population of genomes
Hisat2主要是用来进行转录组数据的比对。
使用--help查看选项和参数。
使用hisat2将reads比对到参考基因组
下面是批量比对:
hisat2批处理脚本内容:
MultiQC整理hisat2结果:
(2)Subjunc:http://subread.sourceforge.net/
第一步依然是构建基因组索引
第2步是使用subjunc将reads比对到参考基因组
subjunc命令运行示例:
下面是sunbjunc批量比对所有样本:
subjunc批处理脚本内容