关于SPAdes的转录本拼接功能的详细说明

SPAdes是一款十分常用的基因组组装软件，可以做RNA拼接，质粒拼接，宏基因组拼接，新冠病毒拼接。适合细菌、真菌使用，如果基因组大小超过100M，就要谨慎使用。可二代数据拼接、二三代混合拼接，也可以hifi数据拼接，我曾经就用这个软件拼接过中肋骨条藻的一个二代基因组和两个二三代混合基因组

与soapdenovo2相比，它不需要写配置文件，输入文件直接写在命令行中就可以

这里，我们不探讨这款软件的基因组拼接功能，我们主要探讨这款软件的另一个功能：trancript的拼接功能。

1.安装

wget http://cab.spbu.ru/files/release3.15.4/SPAdes-3.15.4-Linux.tar.gz

tar -xzf SPAdes-3.15.4-Linux.tar.gz

cd SPAdes-3.15.4-Linux/bin/

#显示bin所在目录

pwd

2.环境配置

#显示文件

ls -a

vi .bash_profile

#进入编辑模式

# .bash_profile

# Get the aliases and functions

if [ -f ~/.bashrc ]; then

. ~/.bashrc

PATH=$PATH:$HOME/.local/bin:$HOME/bin:/data2/users/biosoft/quast:/home/miniconda3/bin:

/data/users/biosoft/SPAdes-3.15.4-Linux/bin:$PATH

export PATH

# Esc退出编辑模式

#保存并退出

:wq!

source .bash_profile

cd SPAdes-3.15.4-Linux/bin/

./spades.py --test

后面加--rna参数，-1左侧reads -2右侧reads -m是运行内存，-t是线程数，-k kmer数可加可不加，若不写，则软件会自动匹配最适合的kmer

示例代码：

nohup spades.py --rna -1 rna2_1.fastq -2 rna2_2.fastq -m 50 -t 10 -o rnaspades2.out &

其中，nohup和&是让程序后台运行，因为拼接时间一般不会太短

就可以了

最后编辑于：2023.02.09 23:00:09