基因组拼接与评估-SPADES安装和组装、Velvet安装与运行2022-10-04

SPADES安装和组装

安装

tar zvxf /disk1/shares/SPAdes-3.12.0-Linux.tar.gz -C ~/Biosofts/ # 从事先准备好的压缩包里解压SPAdes-3.12.0
cd Biosofts/SPAdes-3.12.0-Linux/cd bin

./spades.py -h # 运行
配置环境变量

echo 'export PATH=~/Biosofts/SPAdes-3.12.0-Linux/bin:$PATH' >> ~/.bashrc
 source ~/.bashrc

测试一下:spades.py -h


效果图

组装基因

spades.py --careful --pe1-1 /disk1/shares/Seqs/test_7942raw_1.fq.gz --pe1-2 /disk1/shares/Seqs/test_7942raw_2.fq.gz -o ./SPAdesout

注:这个过程有点长,建议在执行之前使用screen创建一个窗口运行,之后关闭终端也可以继续跑程序。
或者使用 nulop ....&挂在后台运行,千万不要使用Ctrl+Z再使用bg在后台运行,因为这样会让屏幕出现滚屏的现象,干扰我们的命令输入

Velvet

一、下载

sudo apt-get install velvet

velveth测试一下


结果图

运行

velveth velvet_out 31 -shortPaired -fastq -separate /disk1/shares/Seqs/test_7942raw_1.fq.gz /disk1/shares/Seqs/test_7942raw_2.fq.gz # velveth接受输入的文件,产生一个hash表;生成两个文件:Sequences和Roadmaps

velvetg velvet_out -exp_cov auto -cov_cutoff auto -very_clean yes # 组装基因组

二、源代码下载

wget https://github.com/dzerbino/velvet/archive/refs/heads/master.zip
#这里需要服务器端的FTP与上方的github.com的地址配置完善

没有配置好的:

运行结果

配置好的:

image.png

可以使用ping 查看是否能与该网站进行通信

ping成功的

未成功的

注:这里我找了目前的一些网站,都没有能下载,上面图中下载成功的是我换用另一个服务器进行下载的,没想到能够下载成功。同学们有时候下载不了的时候可以换一个服务器尝试一下。
然后我是用scp服务将其传递过来

scp -r user290@gs91.genek.cn:/home/user290/.singularity/master.zip /disk1/202031107010230/myfile/

第二种方法:从事先准备好的安装包里面进行解压文件获得

tar zvxf /disk1/shares/velvet_1.2.10.tgz -C ~/Biosofts/

编译源代码文件使之执行

 make 'CATEGORIES=10' 'MAXKMERLENGTH=127' 'LONGSEQUENCES=1'  'OPENMP=1' 'BUNDLEDZLIB=1'

编写:vi kmerselection.sh

#!/bin/bash
#循环产生步长为8,范围为27-131的拼接结果,并且存储在文件夹之中
Data1=/disk1/shares/Seqs/test_7942raw_1.fq.gz
Data2=/disk1/shares/Seqs/test_7942raw_2.fq.gz
Velvet_dir=~/Biosofts/velvet_1.2.10

for k in `seq 23 8 127`;do
    mkdir velvet$k
    $Velvet_dir/velveth velvet$k $k -shortPaired -fastq -separate $Data1 $Data2
    $Velvet_dir/velvetg velvet$k -exp_cov auto -cov_cutoff auto -very_clean yes

 done

运行脚本

chomd 777 kmerselection.sh # 给脚本加入权限
./kmerselection.sh

循环产生各个kmer的结果

运行效果图

安装quast

尝试运行

./quast.py


效果图

配置环境变量

echo 'export PATH=~/Biosofts/quast-5.0.0:$PATH' >> ~/.bashrc
source ~/.bashrc

代码块

quast.py -o compare\
> _velvet_kmer velvet23/contigs.fa velvet3
velvet31/ velvet39/
> _velvet_kmer velvet23/contigs.fa velvet3
velvet31/ velvet39/
> _velvet_kmer velvet23/contigs.fa velvet31/contigs.fa velvet39/contigs.fa \
> velvet47/contigs.fa velvet55/contigs.fa velvet63/contigs.fa \
> velvet7
velvet71/ velvet79/
> velvet71/contigs.fa velvet79/contigs.fa velvet87/contigs.fa \
> velvet95/contigs.fa velvet103/contigs.fa velvet111/contigs.fa \
> velvet119/contigs.fa velvet127/contigs.fa
#“>” 大于符号是由于在命令行输入\再加回车之后产生的
结果效果图

运行结束后找到输出目录

效果图

下载俩个HTML文件到Windows查看基因拼接效果


repot.heml

icarus.html

本文来源于学习笔记,来源:课程为生物软件安装与应用的小明老师。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容