零、前言
三代PacBio测序可分为:
(1)HiFi(High fidelity reads)模式 -- 较新
(2)CLR(continuous long-read)模式 -- 旧
一、组装
本次组装主要使用 hifiasm,一款专门用于拼接 pacbio hifi 数据的软件
软件链接:https://github.com/chhylp123/hifiasm
组装脚本:
#!/bin/bash
#PBS -l nodes=1:ppn=30
#PBS -l walltime=999:00:00
cd /data/0.user_data/lx_sky6/weipei/genomics/1128-hupinan/1.assembly_hifiasm
export PATH=/home/lx_sky6/yt/soft/miniconda3/bin/:$PATH
#软件安装路径
hifiasm -t 60 --hg-size 1.2g /home/lx_sky6/yt/Dm_hifi_all.fq.gz
#组装命令:
#-t 线程数
#--hg-size survey数据预测的基因组大小
#Dm_hifi_all.fq.gz pacbio三代hifi模式测序数据
awk '/^S/ {print ">"$2"\n"$3}' hifiasm.asm.bp.p_ctg.gfa|seqkit seq -w 60 >DM.hifi_assembled.fasta
#将组装结果转换为 .fasta文件格式
对初步的组装结果进行busco评估
nohup singularity exec /data/0.user_data/lx_sky6/weipei/genomics/1128-hupinan/software_and_singularity/busco_v5.7.1_cv1.sif busco -m geno -i ./DM.hifi_assembled.fasta -o ./viridiplantae_based_hupinan --offline -l /home/lx_sky6/yxl/zangyaohongjingtian/annotation/xy/braker/busco_downloads/embryophyta_odb10 --cpu 28 > busco.log 2>&1
#embryophyta_odb10 有胚植物数据库
busco结果
C:97.9%[S:94.5%,D:3.4%],F:1.9%,M:0.2%,n:1614,E:3.2%
# √还可以