hifiasm组装

参考hifiasm网页代码: https://github.com/chhylp123/hifiasm
ssh 进入一个登录节点
从subreads 里提取hifi数据 利用ccs软件

ccs m64033_210412_083226.subreads.bam m64033_210412_083226.ccs.bam
ccs m64083_210501_064735.subreads.bam m64083_210501_064735.ccs.bam

数据压缩、合并

gzip m64033_210412_083226.ccs.fastq m64083_210501_064735.ccs.fastq
cat  m64033_210412_083226.ccs.fastq.gz  m64083_210501_064735.ccs.fastq.gz > GX.HiFi.fq.gz

运行hifiasm

hifiasm -o test -t32 -f0 GX.HiFi.fq.gz 2 > test.log

-o:定义输出文件的文件名前缀, -t:线程数

get primary contigs in FASTA
提取数据

awk '/^S/{print ">"$2;print $3}'  GX.HiFi.fq.gz > test.p_ctg.fa  

下载fasta文件 test.p_ctg.fa 与基因组文件比对

homozygous genomes
Assemble inbred/homozygous genomes (-l0 disables duplication purging)
hifiasm -o CHM13.asm -t32 -l0 CHM13-HiFi.fa.gz 2> CHM13.asm.log

一般用:f0参数
基因型是杂合的时候参数:l0

minimap比对

参考:[GitHub - lh3/minimap2: A versatile pairwise aligner for genomic and sload/v2.24/minimap2-2.24_x64-linux.tar.bz2 | tar -jxvf -
./minimap2-2.24_x64-linux/minimap2
方法1
(1):index

minimap2 -d ref.mmi R64.fna         

-d FILE: dump index to FILE []
生成索引文件ref.mmi
(2)alignment

nohup minimap2 -a ref.mmi ~/WGS/SY14/pacbio/fastq1/SRR6823435.fastq.gz > alignment1.sam 

在minimap2命令行中用索引文件替换引用序列文件
方法2

nohup minimap2 -ax map-pb R64.fna ~/WGS/SY14/pacbio/fastq1/SRR6823435.fastq.gz > alignment2.sam 

参数设置:
-a: output in the SAM format (PAF by default)
-x STR: preset (always applied before other options; see minimap2.1 for details) []
- map-pb/map-ont - PacBio CLR/Nanopore vs reference mapping
- map-hifi - PacBio HiFi reads vs reference mapping

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容