使用pandaseq合并双端测序实战

注:

(1)本文安装的是pandaseq2.11

(2)安装目录为/opt/pandaseq/2.11,该目录需要提前创建。

(3)本文使用绝对路径,你也可以把/opt/pandaseq/2.11/bin加入到PATH中或者将pandaseq命令软链到某个已经在PATH中的目录。

安装

安装依赖:

apt-get install build-essential libtool automake zlib1g-dev libbz2-dev pkg-config

下载源码:

curl -OL 'https://github.com/neufeld/pandaseq/archive/refs/tags/v2.11.tar.gz'

解压:

tar -zx -f v2.11.tar.gz

编译:

cd pandaseq-2.11/
./autogen.sh
./configure --prefix=/opt/pandaseq/2.11
make -j8
make install

下载测试数据

测试数据我们使用SRR26361709(SRA数据库),可以通过sratools下载。不知道sratools怎么用的同学,可以从我的百度网盘里面下载:

链接: https://pan.baidu.com/s/1-erYl0jZ7bxuwiNUaGgJkw
提取码: cun1

不管使用哪种方法,反正我们最后得到两个文件:

(1)SRR26361709_1.fastq,read1测序文件。

(2)SRR26361709_2.fastq,read2测序文件。

合并

/opt/pandaseq/2.11/bin/pandaseq -T 4 -F -f SRR26361709_1.fastq -r SRR26361709_2.fastq -w SRR26361709.fastq

(1)-T,指定线程数。

(2)-F,指定结果格式为fastq

(3)-f,指定read1测序文件路径。

(4)-r,指定read2测序文件路径。

(5)-w,指定合并结果文件路径。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容